
Maschinelle Übersetzung II
Kursbeschreibung
Dozent | Kurt Eberle |
Veranstaltungsart | Proseminar |
Zeit | Block vom 16.03.09 bis 20.03.09 09:15 - 16:45 Uhr |
Ort | INF 327, SR 6 |
Studiengang | ABA, NBA |
Modul-Kürzel | ABA: A21; NBA: CS-CL, BS-CL |
Leistungsbewertung | NBA: 4/6 ECTS-Punkte (nach Absprache) ABA: 3 ECTS-Punkte |
Teilnahmevoraussetzungen
Kenntnisse im Umfang der Einführungsveranstaltung zur Maschinellen Übersetzung im Sommersemester 2008.
Leistungsnachweis
Das Seminar soll je nach Interesse zu einem größeren oder kleineren Teil über Referate bestritten werden. Wer Interesse an einem Vortrag hat, melde sich bitte in genügendem zeitlichen Abstand vor Beginn des Blockseminars beim Kursleiter (eberle(at)cl.uni-heidelberg.de), zur Beratung und zur Auswahl eines Themas. Diejenigen die kein Referat halten möchen, können an einer Klausur teilnehmen, die eine Woche nach Seminarende angeboten wird. Im Seminar werden sporadisch Aufgaben zu den erarbeiteten Themen gestellt und entsprechende Übungen abgehalten.
Inhalt
Das Seminar soll einen Überblick verschaffen über die Möglichkeiten, unterschiedliche konventionelle Architekturen der Maschinellen Übersetzung zu optimieren und in sog. hybriden Ansätzen zu kombinieren, um Kosten bei der Erstellung zu minimieren und/oder die Qualität der Übersetzung zu steigern. Nach einer Wiederholung zu den Grundlagen der verschiedenenen traditionellen Architekturen werden Konzeptionen zur Weiterentwicklung von Statistik-basierter, Beispiel-basierter und Regel-basierter Übersetzung und hybrider Erweiterungen vorgestellt und diskutiert, wie sie in der neueren Literatur vorgeschlagen wurden. Ein wichtiger Gesichtspunkt ist auch die Evaluation der Übersetzungsleistung und die Inaugenscheinnahme verschiedener Gütemaße, die dafür vorgeschlagen wurden.
Kursübersicht
Datum |
Sitzung |
Materialien |
16.3. |
Verlauf |
|
16.3. |
Wiederholung: Ziele, Aufgaben, Probleme der MT |
|
16.3. |
Wiederholung: Architekturtypen, hybride Architekturen |
|
16.3. |
Übungsaufgaben |
|
17.3. |
Statistische Ansätze und SMT-hybride
Erweiterungen |
|
18.3. |
Beispielbasierte Ansätze und EBMT-hybride
Erweiterungen |
|
19.3. |
Regelbasierte Ansätze und hybride Erweiterungen |
|
20.3. |
Evaluation, Perspektiven, Übungen |
|
27.3. |
Klausur |
|
Literatur
Zur Vorbereitung:- Arnold, D., L. Balkan, R.L. Humphreys, S. Meijer & L. Sadler (1994): Machine Translation: An Introductory Guide, Oxford, NCC Blackwell. Website
- Nirenburg, Sergei (ed.) (2003): Readings in Machine Translation.Cambridge: MIT Press
- Schwanke, M. (1991): Maschinelle Übersetzung - Ein Überblick über Theorie und Praxis, Springer Verlag
- Rujillo, A. (1999): Translation Engines: Techniques for Machine Translation, Springer Verlag
- Sumita, E., Iida, H., Kohyama, H.: Translating with Examples (1990): A New Approach to Machine Translation. The Third International Conference on Theoretical and Methodological Issues in Machine Translation
- Manning, Christopher D., Schütze, Hinrich (1999): Statistical Alignment and Machine Translation. In: Manning, Schütze: Foundations of Statistical NLP, (Chapter 13)
- Forst, Martin (2007): Filling Statistics with Linguistics - Property Design for the Disambiguation of German LFG Parses. In Proceedings of the ACL Workshop on Deep Linguistic Processing, Prague (Czech Republic)
- Babych, B., and Hartley, A. (2008): Sensitivity of Automated MT Evaluation Metrics on Higher Quality MT Output: BLEU vs Task-Based Evaluation Methods. Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). Marrakech, Morocco. 28-30 May 2008
Weitere Literatur, auch zur Auswahl möglicher Referatthemen, wird im Seminar bekannt gegeben.
Papers und Texte zum Seminar
- Arendse Bernth & Michael C. McCord: A hybrid approach to deriving selectional preferences, 23-27 September 2003; pp.9-15.[PDF, 61KB]
- Chris Callison-Burch, Colin Bannard, & Josh Schroeder: Improving statistical translation through editing , 9th EAMT Workshop,"Broadening horizons of machine translation and its applications", 26-27 April 2004, Malta, pp.26-32. [PDF, 227KB]
- Chris Callison-Burch, Philipp Koehn & Miles Osborne: Improved statistical machine translation using paraphrases HLT-NAACL 2006: Proceedings of the Human Language Technology Conference of the North American Chapter of the ACL, New York, USA, June 2006; pp. 17-24 [PDF, 178KB]
- David Chiang: A hierarchical phrase-based model for statistical machine translation. ACL-2005: 43rd Annual meeting of the Association for Computational Linguistics, University of Michigan, Ann Arbor, 25-30 June 2005; pp. 263-270. [PDF, 203KB]
- Kurt Eberle and Reinhard Rapp: Rapid Construction of Explicative Dictionaries Using Hybrid Machine Translation , Lexical Knowledge, Mouton de Gruyter, Berlin, 2008
- Andreas Eisele: Hybrid architectures for machine translation. Second Machine Translation Marathon, Wandlitz, Berlin, Germany, 12-17, May 2008; 29 slides.[PDF, 1167KB]
- Andreas Eisele, Christian Federmann, Hans Uszkoreit, HervéSaint-Amand, Martin Kay, Michael Jellinghaus, Sabine Hunsicker, Teresa Herrmann, & Yu Chen: Hybrid machine translation architectures within and beyond the EuroMatrix project. EAMT 2008: 12th annual conference of the European Association for Machine Translation, September 22 & 23, 2008, Hamburg, Germany, Proceedings, ed. John Hutchins and Walther v.Hahn; pp.27-34.[PDF, 552KB]
- Declan Groves & Andy Way: Hybrid example-based SMT: the best of both worlds? ACL-2005: Workshop on Building and Using Parallel Texts – Data-driven machine translation and beyond, University of Michigan, Ann Arbor, 29-30 June 2005; pp.183-190. [PDF, 65KB]
- Kevin Knight: A Statistical MT Tutorial Workbook, JHU Summer Workshop, John Hopkins University, Baltimore, Maryland, 1999
- Arul Menezes & Chris Quirk: Dependency treelet translation: the convergence of statistical and example-based machine-translation? , Thailand, September 16, 2005, Proceedings of Second Workshop on Example-Based Machine Translation ; pp.99-108.[PDF, 314KB]
- Franz Josef Och & Hermann Ney: Discriminative training and maximum entropy models for statistical machine translation. ACL-2002: 40th Annual meeting of the Association for Computational Linguistics, Philadelphia, July 2002; pp.295-302. [PDF, 152KB]
- Kishore Papineni, Salim Roukos, Todd Ward & Wei-Jing Zhu: BLEU: a method for automatic evaluation of machine translation . ACL-2002: 40th Annual meeting of the Association for Computational Linguistics, Philadelphia, July 2002; pp.311-318. [PDF, 281KB]
- Chris Quirk, Arul Menezes & Colin Cherry: Dependency treelet translation: syntactically informed phrasal SMT. ACL-2005: 43rd Annual meeting of the Association for Computational Linguistics, University of Michigan, Ann Arbor, 25-30 June 2005; pp. 271-279. [PDF, 118KB]
- Gregor Thurmair: Comparing rule-based and statistical MT output. LREC-2004. Workshop, 25th May 2004: The amazing utility of parallel and comparable corpora; pp. 5-9. [PDF, 225KB]
- Gr. Thurmair: Automatic means of MT evaluation. ELRA-HLT Evaluation Workshop,Malta, 1-2 December 2005; 40pp. [PDF from PPT, 2974KB]
Links
- Alex Fraser: MT Reading Group. Institut für Maschinelle SprachverarbeitungUniversität Stuttgart
- John Hutchins: Machine Translation Archive