Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Einführung in die Computerlinguistik

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 ICL 6 LP
NBA ICL 6 LP
Magister - -
Dozenten/-innen Yannick Versley
Tutoren/-innen Julian Hitschler, Julian Baumann
Veranstaltungsart Vorlesung/Übung
Erster Termin 22.10.2013
Zeit und Ort Di, 14:1515:45, INF 328 / SR 25 (SR)
  Mi, 14:1515:45, INF 306 / HS 2 (SR)
Commitment-Frist 02.12.2013 – 17.01.2014

Leistungsnachweis

  • Erfolgreiche Bearbeitung der Übungsaufgaben
  • Erfolgreich bestandene Klausur
  • Aktive Teilnahme

Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb.

Die erfolgreich bestandene Klausur ist Teil der Orientierungsprüfung.

Inhalt

Die Vorlesung führt ein in die Grundlagen, zentralen Fragestellungen und Methoden der Computerlinguistik. In einem Gesamtüberblick werden die wesentlichen Grundlagen der Computerlinguistik eingeführt:

  • Ebenen der Sprachbeschreibung (Phonologie, Morphologie, Syntax, Semantik, Diskurs, Pragmatik),
  • formale mathematische, logische und statistische Modelle zur Beschreibung der entsprechenden linguistischen Phänomene und
  • algorithmische Verfahren zur automatischen Verarbeitung auf Basis dieser Modelle.

Dabei nähern wir uns speziellen Problemen und Fragestellungen der Computerlinguistik und ihren spezifischen Lösungsstrategien. Spezielle Themen werden sein: Ambiguitätsbehandlung, Approximierung sprachlicher Regularitäten, syntaktische und semantische Verarbeitung.

Die Vorlesung gibt einen Überblick über computerlinguistische Anwendungen, diskutiert das Verhältnis zu Nachbardisziplinen, und führt durch praktische Übungen in die speziellen Fragestellungen einzelner Teilgebiete der Computerlinguistik ein.

Im ECL-Wiki kann man Fragen zur Vorlesung oder zu den Tutorien stellen. (Zusätzlich zur Möglichkeit, in der Vorlesung oder den Tutorien direkt zu fragen).

Kursübersicht

Seminarplan

Datum Sitzung Materialien
22.10.2013 Einführung, Organisation Folien
23.10.2013 Einführung, Reguläre Ausdrücke Folien
29.10.2013 Reguläre Ausdrücke, Vorlesungs-Überblick Übungsblatt 1 davinci.txt
Vorlesungs-Überblick
30.10.2013 Endliche Automaten, Endliche Transduktoren;
(Finite-State-)Morphologie
Folien
5.11.2013 Tokenisierung, Minimum Edit Distance Folien
Aufgabe 2
6.11.2013 Wahrscheinlichkeiten, n-gram-Modelle Folien
11.11.2013 Wortartentagging, Hidden Markov Models Folien
Aufgabe 3
Optionale Aufgaben
12.11.2013 Syntax: Konstituenz und Dependenz Folien
18.11.2013 Syntax: Parsingalgorithmen Folien
Aufgabe 4 (bis 3.12.)
19.11.2013 Studieninformationstag, keine Vorlesung.
Freiwillig: Besprechung der optionalen Aufgaben in SR 23
26.11.2013 Syntax: Unifikation Folien
27.11.2013 Syntax: Baumbankgrammatiken, PCFG, Labeled Precision/Recall Folien
Übungsblatt (optional)
3.12.2013 Semantik/Prädikatenlogik Folien
Aufgabe 5 (bis 17.12.)
4.12.2013 Lambda-Kalkül, Kompositionelle Semantik Folien
10.12.2013 Bedeutungspostulate vs. Relationen, Lexikalische Semantik Folien
11.12.2013 Levin-Klassen, FrameNet Folien
Optionale Aufgaben
Aufgabenlösung
17.12.2013 Word sense disambiguation Folien
18.12.2013 Semantische Ähnlichkeit, Muster Folien
Probeklausur
7.1.2014 Distributionelle semantische Ähnlichkeit Folien
Aufgabe 6
8.1.2014 Evaluationsverfahren für distributionelle Ähnlichkeit Folien
14.1.2014 Kohärenz, Anaphern, Diskursstruktur Folien
15.1.2014 Textzusammenfassung Folien
21.1.2014 Machine Translation Folien
22.1.2014 Information Retrieval / Question Answering Folien
28.1.2014 Wiederholung / Überblick Materialübersicht
29.1.2014 Klausur
4.2.2014 Dialogsysteme, Speech
5.2.2014 Studieninformation

Literatur

  • Daniel Jurafsky and James H. Martin (2009): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall Series in Artificial Intelligence. Prentice Hall. http://www.cs.colorado.edu/~martin/slp2.html
  • Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde, Hagen Langer (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg: Spektrum, Akademischer Verlag. (2. bzw. 3. Auflage)
  • Natural Language Toolkit, NLTK: http://www.nltk.org/book

» weitere Kursmaterialien

» Tutorium

zum Seitenanfang