Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Data-driven Methods in Computational Linguistics

Kursbeschreibung

DozentinAnette Frank
VeranstaltungsartHauptseminar
ZeitMittwoch, 11:15 - 12:45 Uhr
OrtINF 325, SR 24
StudiengangABA, NBA, MA
Modul-KürzelABA: V01, NBA: nach Absprache, MA: SS-CL, SS-TAC
LeistungsbewertungNBA: nach Absprache
ABA: 6 ECTS-Punkte
MA: 8 ECTS-Punkte


Teilnahmevoraussetzungen

Magister: Programmierprüfung

Leistungsnachweis

  • Lektüre der zugrundegelegten Literatur
  • Referat
  • Hausarbeit oder Projekt
  • Aktive Teilnahme
  • Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb!

Inhalt

Die moderne Computerlinguistik konzentriert sich in den letzten Jahren in nahezu allen Bereichen der Sprachverarbeitung auf datengetriebene Verfahren. Dies gilt für die Gewinnung computerlinguistischer Ressourcen, wie auch für deren Einsatz in der Sprachverarbeitung, insbesondere für die Disambiguierung. Wir studieren verschiedene Lernverfahren (supervised, semi-supervised, unsupervised, sowie speziellere Verfahren: co-training, active learning, etc.). Im Zentrum stehen Verfahren zur Akquisition linguistischer Ressourcen (Morphologie, Eigennamen, semantische Lexika im weitesten Sinne), sowie datengetriebene Verfahren der Diskursverarbeitung, insbesondere Lesartenselektion, Koreferenzresolution, und Relationserkennung. Ziel ist es, die Methoden und Probleme der verschiedenen Lernverfahren sowie Möglichkeiten der Kombination herauszuarbeiten. Durch die Betrachtung unterschiedlicher linguistischer Phänomenbereiche lernen wir deren spezifische Eigenschaften und entsprechende Techniken der Modellierung und Verarbeitung kennen. Schließlich sollen grundlegende Techniken datengetriebener experimenteller Verfahren (Versuchsaufbau, Datenaufbereitung, Training, Evaluation, etc.) herausgearbeitet werden.

Literatur

  • Eric Brill and Raymond J. Mooney (1997): An Overview of Empirical Natural Language Processing, AI Magazine, Special Issue on Empirical Natural Language Processing, 18(4), 13-24.

  • Special Issue on Empirical Natural Language Processing, AI Magazine, 18(4), Winter 1997.

  • Raymond J. Mooney (2003): Machine Learning. In: R. Mitkov (Ed.): Oxford Handbook of Computational Linguistics, Oxford University Press, pp. 376-394.

  • Ian H. Witten and Eibe Frank (2000): Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann.
Weitere Literatur wird im Laufe des Seminars bekanntgegeben.

» Kursübersicht und weitere Kursmaterialien

zum Seitenanfang