Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Statistical Machine Translation

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8 LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8 LP
Magister - -
ÜK - 4 LP
Dozenten/-innen Alexander Fraser,
Laura Jehl
Veranstaltungsart Vorlesung/Übung
Erster Termin 24.04.2014
Zeit und Ort Do, 11:1512:45,
INF 325 / SR 23 (SR) (Vorlesung)
  Mo, 16:1517:45,
INF 325 / SR 23 (SR) (Übung)
Commitment-Frist 16.06.13.07.2014

Teilnahmevoraussetzungen

Grundlagen der Wahrscheinlichkeitstheorie und Linearen Algebra, z.B. aus Mathematischem Grundkurs oder Statistical Methods.

Leistungsnachweis

  • Regelmäßige Teilnahme an Vorlesung und Übung
  • Bearbeitung der Übungsaufgaben (2 mal schriftliche Abgabe und Vorstellen einer Aufgabe)
  • "Language in 10 Minutes" Referat in der Übung
  • Bearbeitung der Programmieraufgaben
  • Klausur

Inhalt

Die Vorlesung stellt zentrale Konzepte der Statistischen Maschinellen Übersetzung vor. Mögliche Themenbereiche der Vorlesung sind:

  • Alignment
  • Wort-basierte Modelle
  • Phrasen-basierte Modelle
  • Syntax-basierte Modelle
  • Dekodierung
  • Sprachmodelle
  • Evaluierung

Kursübersicht

Seminarplan

Datum Sitzung Materialien Übungsblatt
2014-04-24 Details, Introduction and Evaluation powerpoint slides Übungsblatt 1 (Ü1: Fritz, Ü2: Remse; Referate: Remse (Altgriechisch), Allgaier (Solomon Islands Pijin))
2014-05-08 Word Alignment I - IBM Model 1 powerpoint slides (UPDATED 2014-05-22!) Übungsblatt 2 (Ü1: Mücke, Ü2: Dagaydin, Ü3: Claus)
2014-05-15 Word Alignment II - IBM Model 1 again + the trick (same slide set, but see updated slides at end) Programmieraufgabe 1
(Präsentation: Schmid)
2014-05-22 Word Alignment III - IBM Models 2 to 5 powerpoint slides Übungsblatt 3 (Ü1: Baumann, Ü2: Tikhoncheva)
2014-06-05 Advanced Word Alignment | Phrase-based Model slides4 (word align) | slides5 (phrase-based model) Übungsblatt 4 (Ü1: Fritz)
2014-06-12 Phrase-based Decoding powerpoint slides Übungsblatt 5 (Ü1: Krauss, Cramer)
Programmieraufgabe 2
2014-06-26 Evaluation pdf slides Übungsblatt 6 (Ü1: Andriamboavonjy, Ü2: Hees)
2014-07-03 Log-Linear Models powerpoint slides Übungsblatt 7 (Ü1: Allgaier, Ü2: Kühl)
2014-07-10 Better Word Alignment, Morphology, Syntax powerpoint slides
2014-07-17 Klausur
2014-07-24 English to German Translation: Generating German Morphology powerpoint slides

Literatur

Grundlage der Vorlesung ist

  • Koehn (2010). Statistical Machine Translation . Cambridge. Link: http://www.statmt.org/book/

» Tutorium

» weitere Kursmaterialien

zum Seitenanfang