Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Einführung in die Computerlinguistik

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 ICL 6 LP
NBA ICL 6 LP
Magister - -
Dozenten/-innen Yannick Versley
Veranstaltungsart Vorlesung/Übung
Erster Termin 20.10.2014
Zeit und Ort Mo, 14:1515:45, INF 328 / SR 25 (SR)
  Mi, 11:1512:45, INF 327 / SR 20 (SR)
Commitment-Frist Bitte committen Sie sich bis zum 18.1. für die ECL-Vorlesung!
Klausurtermin: 11.2.2015, 11h (bitte 11h00 dasein), SR 20 (INF 327) (wir haben leider keinen größeren Raum bekommen)

Leistungsnachweis

  • Erfolgreiche Bearbeitung der Übungsaufgaben
  • Erfolgreich bestandene Klausur
  • Aktive Teilnahme

Regelmäßige Präsenz ist Voraussetzung für den Scheinerwerb.

Die erfolgreich bestandene Klausur ist Teil der Orientierungsprüfung.

Inhalt

Die Vorlesung führt ein in die Grundlagen, zentralen Fragestellungen und Methoden der Computerlinguistik. In einem Gesamtüberblick werden die wesentlichen Grundlagen der Computerlinguistik eingeführt:

  • Ebenen der Sprachbeschreibung (Phonologie, Morphologie, Syntax, Semantik, Diskurs, Pragmatik),
  • formale mathematische, logische und statistische Modelle zur Beschreibung der entsprechenden linguistischen Phänomene und
  • algorithmische Verfahren zur automatischen Verarbeitung auf Basis dieser Modelle.

Dabei nähern wir uns speziellen Problemen und Fragestellungen der Computerlinguistik und ihren spezifischen Lösungsstrategien. Spezielle Themen werden sein: Ambiguitätsbehandlung, Approximierung sprachlicher Regularitäten, syntaktische und semantische Verarbeitung.

Die Vorlesung gibt einen Überblick über computerlinguistische Anwendungen, diskutiert das Verhältnis zu Nachbardisziplinen, und führt durch praktische Übungen in die speziellen Fragestellungen einzelner Teilgebiete der Computerlinguistik ein.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
20.10.2014 Einführung: Was ist Computerlinguistik? Einführung
22.10.2014 Einführung: Was machen wir in ECL? Einführung
27.10.2014
29.10.2014
Reguläre Ausdrücke, endliche Automaten,
morphologische Phänomene
Folien: RegEx/FSA/Morph
Aufgabe 1
davinci.txt
3.11.2014 Transducer, FST-Morphologie, WFST Folien: Transducer/Morph/WFST
Aufgabe 2
Schiller2005 (Ergänzung zu WFST)
5.11.2014 Tokenisierung, Edit Distance Folien: Tokenisierung, Edit Distance
10.11.2014 Edit Distance, Frequenzen, Wahrscheinlichkeiten Folien: Häufigkeiten und Markov-Modelle
Aufgabe 3
17.11.2014
19.11.2014 (s.t.!!!)
Part-of-Speech, Tagging mit HMMs Folien: Tagging
Aufgabe 4
24.11.2014 Syntax, Grammatik, CFG Folien: Syntax
Freiwilliges Übungsblatt
26.11.2014 Parsingalgorithmen für CFG Folien: CYK/Earley
1.12.2014 Unifikation Folien: Unifikation
03.12.2014 Baumbanken, PCFG Folien: PCFG
Aufgabe 5 (bis 17.12.)
8.12.2014
10.12.2014
Agenda-Parsing, PCFG-Parsing mit Agenda
Kompositionale Semantik
Agenda-Parsing
Semantik: Einführung
Semantik: Lambda-Ausdrücke
15.12.2014 Semantik: Lambda-Ausdrücke und Typen Semantik: Typen
17.12.2015 Semantik: WordNet und Lexika Semantik: Lexikon
7.01.2015 Semantik: Word Sense Disambiguation Semantik: WSD
12.01.2015 Semantik: Supersenses, Perzeptron und Semantic Role Labeling Semantik: SRL
Aufgabe 6
Bonusaufgaben
Hintergrund zum Perzeptron: Kapitel aus Daumés "Course in Machine Learning
14.01.2015 Semantik: Distributionelle Ähnlichkeit Folien: Distributionelle Ähnlichkeit
19.01.2015
21.01.2015
Diskurs: Kohärenz und Koreferenz, Textzusammenfassung Folien: Diskurs
Folien: Textzusammenfassung
26.01.2015 Probeklausur (im Wiki)
02.02.2015 Machine Translation Folien: Machine Translation

Literatur

  • Daniel Jurafsky and James H. Martin (2009): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall Series in Artificial Intelligence. Prentice Hall. http://www.cs.colorado.edu/~martin/slp2.html
  • Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde, Hagen Langer (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg: Spektrum, Akademischer Verlag. (2. bzw. 3. Auflage)
  • Natural Language Toolkit, NLTK

» weitere Kursmaterialien

» Tutorium

zum Seitenanfang