Einführung in die Computerlinguistik
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | ICL | 6 LP |
NBA | ICL | 6 LP |
Magister | - | - |
Dozenten/-innen | Yannick Versley |
Tutoren/-innen | Julian Hitschler, Julian Baumann |
Veranstaltungsart | Vorlesung/Übung |
Erster Termin | 22.10.2013 |
Zeit und Ort | Di, 14:15–15:45, INF 328 / SR 25 (SR) |
Mi, 14:15–15:45, INF 306 / HS 2 (SR) | |
Commitment-Frist | 02.12.2013 – 17.01.2014 |
Leistungsnachweis
-
Erfolgreiche Bearbeitung der Übungsaufgaben
- Erfolgreich bestandene Klausur
- Aktive Teilnahme
Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb.
Die erfolgreich bestandene Klausur ist Teil der Orientierungsprüfung.
Inhalt
Die Vorlesung führt ein in die Grundlagen, zentralen Fragestellungen und Methoden der Computerlinguistik. In einem Gesamtüberblick werden die wesentlichen Grundlagen der Computerlinguistik eingeführt:
- Ebenen der Sprachbeschreibung (Phonologie, Morphologie, Syntax, Semantik, Diskurs, Pragmatik),
- formale mathematische, logische und statistische Modelle zur Beschreibung der entsprechenden linguistischen Phänomene und
-
algorithmische Verfahren zur automatischen Verarbeitung auf Basis dieser Modelle.
Dabei nähern wir uns speziellen Problemen und Fragestellungen der Computerlinguistik
und ihren spezifischen Lösungsstrategien. Spezielle Themen werden sein: Ambiguitätsbehandlung,
Approximierung sprachlicher Regularitäten, syntaktische und semantische Verarbeitung.
Die Vorlesung gibt einen Überblick über computerlinguistische Anwendungen, diskutiert
das Verhältnis zu Nachbardisziplinen, und führt durch praktische Übungen in die speziellen
Fragestellungen einzelner Teilgebiete der Computerlinguistik ein.
Im ECL-Wiki kann man Fragen zur Vorlesung oder zu den Tutorien stellen. (Zusätzlich zur Möglichkeit, in der Vorlesung oder den Tutorien direkt zu fragen).
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
22.10.2013 | Einführung, Organisation | Folien |
23.10.2013 | Einführung, Reguläre Ausdrücke | Folien |
29.10.2013 | Reguläre Ausdrücke, Vorlesungs-Überblick | Übungsblatt 1 davinci.txt Vorlesungs-Überblick |
30.10.2013 | Endliche Automaten, Endliche Transduktoren; (Finite-State-)Morphologie |
Folien |
5.11.2013 | Tokenisierung, Minimum Edit Distance | Folien Aufgabe 2 |
6.11.2013 | Wahrscheinlichkeiten, n-gram-Modelle | Folien |
11.11.2013 | Wortartentagging, Hidden Markov Models | Folien Aufgabe 3 Optionale Aufgaben |
12.11.2013 | Syntax: Konstituenz und Dependenz | Folien |
18.11.2013 | Syntax: Parsingalgorithmen | Folien Aufgabe 4 (bis 3.12.) |
19.11.2013 | Studieninformationstag, keine Vorlesung. Freiwillig: Besprechung der optionalen Aufgaben in SR 23 | |
26.11.2013 | Syntax: Unifikation | Folien |
27.11.2013 | Syntax: Baumbankgrammatiken, PCFG, Labeled Precision/Recall | Folien Übungsblatt (optional) |
3.12.2013 | Semantik/Prädikatenlogik | Folien Aufgabe 5 (bis 17.12.) |
4.12.2013 | Lambda-Kalkül, Kompositionelle Semantik | Folien |
10.12.2013 | Bedeutungspostulate vs. Relationen, Lexikalische Semantik | Folien |
11.12.2013 | Levin-Klassen, FrameNet | Folien Optionale Aufgaben Aufgabenlösung |
17.12.2013 | Word sense disambiguation | Folien |
18.12.2013 | Semantische Ähnlichkeit, Muster | Folien Probeklausur |
7.1.2014 | Distributionelle semantische Ähnlichkeit | Folien Aufgabe 6 |
8.1.2014 | Evaluationsverfahren für distributionelle Ähnlichkeit | Folien |
14.1.2014 | Kohärenz, Anaphern, Diskursstruktur | Folien |
15.1.2014 | Textzusammenfassung | Folien |
21.1.2014 | Machine Translation | Folien |
22.1.2014 | Information Retrieval / Question Answering | Folien |
28.1.2014 | Wiederholung / Überblick | Materialübersicht |
29.1.2014 | Klausur | |
4.2.2014 | Dialogsysteme, Speech | |
5.2.2014 | Studieninformation |
Literatur
- Daniel Jurafsky and James H. Martin (2009): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall Series in Artificial Intelligence. Prentice Hall. http://www.cs.colorado.edu/~martin/slp2.html
-
Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde,
Hagen Langer (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung.
Heidelberg: Spektrum, Akademischer Verlag. (2. bzw. 3. Auflage)
- Natural Language Toolkit, NLTK: http://www.nltk.org/book