
Einführung in die Computerlinguistik
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | ICL | 6 LP |
NBA | ICL | 6 LP |
Magister | - | - |
Dozenten/-innen | Yannick Versley |
Veranstaltungsart | Vorlesung/Übung |
Erster Termin | 20.10.2014 |
Zeit und Ort | Mo, 14:15–15:45, INF 328 / SR 25 (SR) |
Mi, 11:15–12:45, INF 327 / SR 20 (SR) | |
Commitment-Frist | Bitte committen Sie sich bis zum 18.1. für die ECL-Vorlesung! Klausurtermin: 11.2.2015, 11h (bitte 11h00 dasein), SR 20 (INF 327) (wir haben leider keinen größeren Raum bekommen) |
Leistungsnachweis
-
Erfolgreiche Bearbeitung der Übungsaufgaben
- Erfolgreich bestandene Klausur
- Aktive Teilnahme
Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb.
Die erfolgreich bestandene Klausur ist Teil der Orientierungsprüfung.
Inhalt
Die Vorlesung führt ein in die Grundlagen, zentralen Fragestellungen und Methoden der Computerlinguistik. In einem Gesamtüberblick werden die wesentlichen Grundlagen der Computerlinguistik eingeführt:
- Ebenen der Sprachbeschreibung (Phonologie, Morphologie, Syntax, Semantik, Diskurs, Pragmatik),
- formale mathematische, logische und statistische Modelle zur Beschreibung der entsprechenden linguistischen Phänomene und
-
algorithmische Verfahren zur automatischen Verarbeitung auf Basis dieser Modelle.
Dabei nähern wir uns speziellen Problemen und Fragestellungen der Computerlinguistik
und ihren spezifischen Lösungsstrategien. Spezielle Themen werden sein: Ambiguitätsbehandlung,
Approximierung sprachlicher Regularitäten, syntaktische und semantische Verarbeitung.
Die Vorlesung gibt einen Überblick über computerlinguistische Anwendungen, diskutiert
das Verhältnis zu Nachbardisziplinen, und führt durch praktische Übungen in die speziellen
Fragestellungen einzelner Teilgebiete der Computerlinguistik ein.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
20.10.2014 | Einführung: Was ist Computerlinguistik? | Einführung |
22.10.2014 | Einführung: Was machen wir in ECL? | Einführung |
27.10.2014 29.10.2014 |
Reguläre Ausdrücke, endliche Automaten, morphologische Phänomene |
Folien: RegEx/FSA/Morph Aufgabe 1 davinci.txt |
3.11.2014 | Transducer, FST-Morphologie, WFST | Folien: Transducer/Morph/WFST Aufgabe 2 Schiller2005 (Ergänzung zu WFST) |
5.11.2014 | Tokenisierung, Edit Distance | Folien: Tokenisierung, Edit Distance |
10.11.2014 | Edit Distance, Frequenzen, Wahrscheinlichkeiten | Folien: Häufigkeiten und Markov-Modelle Aufgabe 3 |
17.11.2014 19.11.2014 (s.t.!!!) |
Part-of-Speech, Tagging mit HMMs | Folien: Tagging Aufgabe 4 |
24.11.2014 | Syntax, Grammatik, CFG | Folien: Syntax Freiwilliges Übungsblatt |
26.11.2014 | Parsingalgorithmen für CFG | Folien: CYK/Earley |
1.12.2014 | Unifikation | Folien: Unifikation |
03.12.2014 | Baumbanken, PCFG | Folien: PCFG Aufgabe 5 (bis 17.12.) |
8.12.2014 10.12.2014 |
Agenda-Parsing, PCFG-Parsing mit Agenda Kompositionale Semantik |
Agenda-Parsing Semantik: Einführung Semantik: Lambda-Ausdrücke |
15.12.2014 | Semantik: Lambda-Ausdrücke und Typen | Semantik: Typen |
17.12.2015 | Semantik: WordNet und Lexika | Semantik: Lexikon |
7.01.2015 | Semantik: Word Sense Disambiguation | Semantik: WSD |
12.01.2015 | Semantik: Supersenses, Perzeptron und Semantic Role Labeling | Semantik: SRL Aufgabe 6 Bonusaufgaben Hintergrund zum Perzeptron: Kapitel aus Daumés "Course in Machine Learning |
14.01.2015 | Semantik: Distributionelle Ähnlichkeit | Folien: Distributionelle Ähnlichkeit |
19.01.2015 21.01.2015 |
Diskurs: Kohärenz und Koreferenz, Textzusammenfassung | Folien: Diskurs Folien: Textzusammenfassung |
26.01.2015 | Probeklausur | (im Wiki) |
02.02.2015 | Machine Translation | Folien: Machine Translation |
Literatur
- Daniel Jurafsky and James H. Martin (2009): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall Series in Artificial Intelligence. Prentice Hall. http://www.cs.colorado.edu/~martin/slp2.html
- Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde, Hagen Langer (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg: Spektrum, Akademischer Verlag. (2. bzw. 3. Auflage)
- Natural Language Toolkit, NLTK