Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Formale Grundlagen der Computerlinguistik: Mathematische Grundlagen

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 FF-FM 6 LP
NBA FF-FM 6 LP
Magister - -
Dozenten/-innen Matthias Hartung
Veranstaltungsart Vorlesung/Übung
Erster Termin 22.04.2013
Zeit und Ort Mo, 11:1512:45, INF 306 / SR 14 (SR)
  Mo, 15.07.2013, INF 306 / SR 19 (SR)
Commitment-Frist 20.05.13.07.2013

Leistungsnachweis

  • Klausur
  • Übungsaufgaben

Inhalt

Die Veranstaltung vermittelt eine Einführung in die Typen formaler Sprachen sowie die mathematischen Grundlagen der symbolischen und probabilistischen Sprachmodellierung.

Zentrale Themen der Vorlesung sind im einzelnen:

  • Wahrscheinlichkeitsmodelle und Estimierungsverfahren
  • allgemeine Regelsprachen und Regelgrammatiken
  • Chomsky-Hierarchie der formalen Sprachen
  • endliche Automaten und Markov-Ketten
  • Hidden Markov Models
  • probabilistische kontextfreie Grammatiken

Kursübersicht

Seminarplan

Datum Sitzung Materialien
22.04. Organisatorisches, Einführung Folien
29.04. Wahrscheinlichkeitstheoretische Grundbegriffe Folien (Update: 06.05.)
06.05. Entropie Folien
13.05. Kreuzentropie Folien (Update: 27.05.)
27.05. Bedingte Wahrscheinlichkeit Folien
03.06. Bayes' Theorem, Naive Bayes Classification Folien
10.06. Bayesianische Graphische Modelle Folien
17.06. Formale Sprachen, Allgemeine Regelgrammatik Folien
24.06. Endliche Automaten Folien
01.07. Reguläre Sprachen, Markov-Ketten Folien
08.07. Hidden Markov Models Folien
15.07. Klausur
22.07. Kontextfreie Grammatiken, PCFGs, Ausblick Folien

Tutorien

  • Dienstag, 18-20 Uhr, INF 306 SR 19 (Jasmin Schröck)
  • Donnerstag, 16-18 Uhr, INF 327 SR 2 (Angela Schneider)

Fragen, Rückmeldung

...bitte über die Wiki-Seite.

Klausur

Die Abschlußklausur zu dieser Vorlesung wird am Montag, 15.07., zur gewohnten Vorlesungszeit stattfinden. Beachtet die Raumänderung (s.o.)!

Als Hilfsmittel zugelassen sind je Teilnehmer/in ein einseitig beliebig beschriebenes DIN A4-Blatt und ein Taschenrechner.

Alle Kursteilnehmer/innen, die nicht zur Klausur zugelassen sind, wurden per Mail benachrichtigt (Stand: 12.07., 14.00 Uhr).

Aufgaben

  • Blatt 1 (Abgabe bis: Fr, 10.05., 23:59 Uhr)
  • Blatt 2 (Abgabe bis: Do, 16.05., 23:59 Uhr), dazu: raven.txt und shannon.py
  • Blatt 3 (Abgabe bis: Do, 23.05., 23:59 Uhr)
  • Blatt 4 (Abgabe bis: Do, 06.06., 23:59 Uhr)
  • Blatt 5 (Abgabe bis: Do, 20.06., 23:59 Uhr)
  • Blatt 6 (nachträglich zum Selbststudium; Abgabe bis: Di, 09.07., 23:59 Uhr)
  • Blatt 7 (Abgabe bis: Do, 04.07., 23:59 Uhr)
  • Blatt 8 (Update: 05.07.; Abgabe bis: Do, 11.07., 23:59 Uhr), dazu: ab.txt

Literatur

  • Bishop, C.: Pattern Recognition and Machine Learning, Springer, 2006
  • Charniak, E.: Statistical Language Learning, MIT Press, 1996
  • Hopcroft, J.E. and Ullman, J.D.: Introduction to Automata Theory, Languages and Computation, Addison Wesley, 1979
  • Klabunde, R.: Formale Grundlagen der Linguistik, Narr, 1998
  • Partee, B. et al.: Mathematical Methods in Linguistics, Kluwer, 1990
  • Vossen, G. und Witt, K.-U.: Grundlagen der Theoretischen Informatik mit Anwendungen, Vieweg, 2001

» weitere Kursmaterialien

zum Seitenanfang