Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Einführung in die Computerlinguistik - Materialübersicht

« zurück

Zugriffsbeschränkte Kursseite

Im Laufe des Semesters werden auf dieser Seite Kursmaterialien zur Verfügung gestellt. Alle Aufgabenloesungen sind Skizzen. Wenn Sie Fehler finden, bitte darauf aufmerksam machen.

Hier gehts zum Tutorium

Kursübersicht

Seminarplan

DatumSitzungMaterialien
23.10. Einführung Organisation
Einführung
24.10 Spracheigenschaften und Kognitives Folien
Längeres Transkript mit Koko, dem Gorilla
Übungsblatt 1 Loesungen I
30.10 Reguläre Ausdrücke; Automaten Folien reguläre Ausdrücke
Folien Automaten
31.10 Reguläre Ausdrücke; Automaten Übungsblatt 2
Lösungen 2
Kostenloses E-Book mit Aufgaben und Loesungen zu Automaten (nicht alle Kapitel relevant)
6.11 Minimum Edit Distance Folien Minimum Edit Distance
7.11 Korpora, Tokenisierung, Normalisierung Folien
Übungsblatt 3 (Aufgabe 3 korrigiert, 13.11.2019)
Lösungen 3
13.11 Wahrscheinlichkeit Folien
14.11 Entropie Folien Entropie
Übungsblatt 4
Loesungen 4
20.11 Language Modelling Folien Language Modelling
21.11 Language Modelling Übungsblatt 5
Lösungen 5
27.11 Textklassifikation Folien Textklassifikation
28.11 Textklassifikation Übungsblatt 6 (Korrektur (Typo bei Aufgabe 3 sowie Punkteverteilung bei Aufgabe 3) hochgeladen 30 November!!
Lösungen 6
4.12 POS tagging Folien POS I
STTS Tagset
Penn treebank Tagset
5.12 POS Tagging Folien POS II
Tafelbeispiel aus der Vorlesung
Übungsblatt 7
Lösungen 7
11.12 Syntax, Parsing Folien Syntax
Beispiele zu Penn treebank Trees
12.12 Parsing Folien Parsing
Übungsblatt 8
Loesungen 8
18.12 Parsing Folien PCFG
Handout CNF Konvertierung
19.12 Wortsemantik Folien
Übungsblatt 9. Letztes Übungsblatt zur Klausurzulassung. Update wegen einer vergessenen Zeile in Aufgabe 2 am 5.1.2020
Lösungen 9
8.1 Distributionelle Semantik Folien Distributionelle Semantik
9.1, SR 20 (!!!) Distributionelle Semantik, Clustering
15.1 Clustering Folien Clustering ( Update des fehlerhaften Beispiels 28.1.2020, wichtig!)
Übungsblatt 10, unkorrigiert.
Loesungen 10
16.1 entfällt, kein Raum
22.1 IR Folien IR
Eine Liste ueber die jetzt schon ueber 200 Ranking-Faktoren, die Google benutzt (die Liste ist teilweise spekulativ, da ja die genauen Faktoren geheim sind), finden Sie hier . TFIDF ist Nummer 15, Pagerank Nummer 53.
23.1 IR Übungsblatt 11, letztes Übungsblatt. Unkorrigiert
Loesungen 11
29.1 Diskurs Diskursfolien
30.1 Diskurs Folien Diskursalgorithmen
5.2 Stoffwiederholung Klausur
6.2 (Büro Markert) Private Sprechstunde zu Klausurfragen
Klausurtermin, Mi. 12.2. (10-13 Uhr, HS2) Klausur aus WS 16/17
Klausur-FAQ ( Stand 28.1.2020, Änderung auf Folie 13)
-->
zum Seitenanfang