
Data-driven Methods in Computational Linguistics
Kursbeschreibung
Dozentin | Anette Frank |
Veranstaltungsart | Hauptseminar |
Zeit | Mittwoch, 11:15 - 12:45 Uhr |
Ort | INF 325, SR 24 |
Studiengang | ABA, NBA, MA |
Modul-Kürzel | ABA: V01, NBA: nach Absprache, MA: SS-CL, SS-TAC |
Leistungsbewertung | NBA: nach Absprache ABA: 6 ECTS-Punkte MA: 8 ECTS-Punkte |
Teilnahmevoraussetzungen
Magister: Programmierprüfung
Leistungsnachweis
- Lektüre der zugrundegelegten Literatur
- Referat
- Hausarbeit oder Projekt
- Aktive Teilnahme
- Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb!
Inhalt
Die moderne Computerlinguistik konzentriert sich in den letzten Jahren in nahezu allen Bereichen der Sprachverarbeitung auf datengetriebene Verfahren. Dies gilt für die Gewinnung computerlinguistischer Ressourcen, wie auch für deren Einsatz in der Sprachverarbeitung, insbesondere für die Disambiguierung. Wir studieren verschiedene Lernverfahren (supervised, semi-supervised, unsupervised, sowie speziellere Verfahren: co-training, active learning, etc.). Im Zentrum stehen Verfahren zur Akquisition linguistischer Ressourcen (Morphologie, Eigennamen, semantische Lexika im weitesten Sinne), sowie datengetriebene Verfahren der Diskursverarbeitung, insbesondere Lesartenselektion, Koreferenzresolution, und Relationserkennung. Ziel ist es, die Methoden und Probleme der verschiedenen Lernverfahren sowie Möglichkeiten der Kombination herauszuarbeiten. Durch die Betrachtung unterschiedlicher linguistischer Phänomenbereiche lernen wir deren spezifische Eigenschaften und entsprechende Techniken der Modellierung und Verarbeitung kennen. Schließlich sollen grundlegende Techniken datengetriebener experimenteller Verfahren (Versuchsaufbau, Datenaufbereitung, Training, Evaluation, etc.) herausgearbeitet werden.
Literatur
-
Eric Brill and Raymond J. Mooney (1997): An Overview of Empirical Natural Language Processing, AI Magazine, Special Issue on Empirical Natural Language Processing, 18(4), 13-24.
-
Special Issue on Empirical Natural Language Processing, AI Magazine, 18(4), Winter 1997.
-
Raymond J. Mooney (2003): Machine Learning. In: R. Mitkov (Ed.): Oxford Handbook of Computational Linguistics, Oxford University Press, pp. 376-394.
- Ian H. Witten and Eibe Frank (2000): Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann.