Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Maschinelle Übersetzung II

Kursbeschreibung

DozentKurt Eberle
VeranstaltungsartProseminar
ZeitBlock vom 16.03.09 bis 20.03.09
09:15 - 16:45 Uhr
OrtINF 327, SR 6
StudiengangABA, NBA
Modul-KürzelABA: A21; NBA: CS-CL, BS-CL
LeistungsbewertungNBA: 4/6 ECTS-Punkte (nach Absprache)
ABA: 3 ECTS-Punkte


Teilnahmevoraussetzungen

Kenntnisse im Umfang der Einführungsveranstaltung zur Maschinellen Übersetzung im Sommersemester 2008.

Leistungsnachweis

Das Seminar soll je nach Interesse zu einem größeren oder kleineren Teil über Referate bestritten werden. Wer Interesse an einem Vortrag hat, melde sich bitte in genügendem zeitlichen Abstand vor Beginn des Blockseminars beim Kursleiter (eberle(at)cl.uni-heidelberg.de), zur Beratung und zur Auswahl eines Themas. Diejenigen die kein Referat halten möchen, können an einer Klausur teilnehmen, die eine Woche nach Seminarende angeboten wird. Im Seminar werden sporadisch Aufgaben zu den erarbeiteten Themen gestellt und entsprechende Übungen abgehalten.

Inhalt

Das Seminar soll einen Überblick verschaffen über die Möglichkeiten, unterschiedliche konventionelle Architekturen der Maschinellen Übersetzung zu optimieren und in sog. hybriden Ansätzen zu kombinieren, um Kosten bei der Erstellung zu minimieren und/oder die Qualität der Übersetzung zu steigern. Nach einer Wiederholung zu den Grundlagen der verschiedenenen traditionellen Architekturen werden Konzeptionen zur Weiterentwicklung von Statistik-basierter, Beispiel-basierter und Regel-basierter Übersetzung und hybrider Erweiterungen vorgestellt und diskutiert, wie sie in der neueren Literatur vorgeschlagen wurden. Ein wichtiger Gesichtspunkt ist auch die Evaluation der Übersetzungsleistung und die Inaugenscheinnahme verschiedener Gütemaße, die dafür vorgeschlagen wurden.

Kursübersicht

Datum

Sitzung

Materialien

16.3.

Verlauf

Folien

16.3.

Wiederholung: Ziele, Aufgaben, Probleme der MT

Folien

(+Folien Ambiguität)

16.3.

Wiederholung: Architekturtypen, hybride Architekturen

Architekturfolien

HybrideSysteme_Eisele

16.3.

Übungsaufgaben

Folien

17.3.

Statistische Ansätze und SMT-hybride Erweiterungen

 

18.3.

Beispielbasierte Ansätze und EBMT-hybride Erweiterungen

 

19.3.

Regelbasierte Ansätze und hybride Erweiterungen

 

20.3.

Evaluation, Perspektiven, Übungen

 

27.3.

Klausur

 

Literatur

Zur Vorbereitung:
  • Arnold, D., L. Balkan, R.L. Humphreys, S. Meijer & L. Sadler (1994): Machine Translation: An Introductory Guide, Oxford, NCC Blackwell. Website
  • Nirenburg, Sergei (ed.) (2003): Readings in Machine Translation.Cambridge: MIT Press
  • Schwanke, M. (1991): Maschinelle Übersetzung - Ein Überblick über Theorie und Praxis, Springer Verlag
  • Rujillo, A. (1999): Translation Engines: Techniques for Machine Translation, Springer Verlag
Einführung in verschiedene Themenkreise:
  • Sumita, E., Iida, H., Kohyama, H.: Translating with Examples (1990): A New Approach to Machine Translation. The Third International Conference on Theoretical and Methodological Issues in Machine Translation
  • Manning, Christopher D., Schütze, Hinrich (1999): Statistical Alignment and Machine Translation. In: Manning, Schütze: Foundations of Statistical NLP, (Chapter 13)
  • Forst, Martin (2007): Filling Statistics with Linguistics - Property Design for the Disambiguation of German LFG Parses. In Proceedings of the ACL Workshop on Deep Linguistic Processing, Prague (Czech Republic)
  • Babych, B., and Hartley, A. (2008): Sensitivity of Automated MT Evaluation Metrics on Higher Quality MT Output: BLEU vs Task-Based Evaluation Methods. Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). Marrakech, Morocco. 28-30 May 2008

Weitere Literatur, auch zur Auswahl möglicher Referatthemen, wird im Seminar bekannt gegeben.

Papers und Texte zum Seminar

Links

 

 

zum Seitenanfang