Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Kontrolle und Korrektur von MT-Output

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-FL 8 LP
Master SS-CL, SS-FAL 8 LP
Dozenten/-innen Kurt Eberle
Veranstaltungsart Proseminar/Hauptseminar
Sprache Deutsch
Erster Termin 04.10.2022
Letzter Termin 07.10.2022
Zeit und Ort 09:15-14:30 Uhr
INF 327/SR4
Commitment-Frist tbd.

Teilnahmevoraussetzungen

  • Einführung CL
  • Grundkenntnisse zu Maschineller Übersetzung (Grundarchitekturen früher und heute)

Leistungsnachweis

Vortrag und/oder Klausur

Moodle-Seite

Inhalt

In dem Seminar sollen Möglichkeiten vorgestellt und diskutiert werden, den Output eines MT-Systems qualitativ einzuschätzen und bei Bedarf zu verbessern. Dabei wird es um grammatische und stilistische Kontrolle gehen, um das Einbeziehen passender (Domänen-spezischer) Terminologien, um möglichst effizientes Postediting, das versucht manuelle Korrektur möglichst ergonomisch zu gestalten und auf ein Minimum zu begrenzen, was bedeutet, wo möglich, grammatisches und Formulierungswissen dynamisch und automatisch einzubeziehen. In diesem Zusammenhang wird es auch um Corpora für MT, insbesondere Translation Memories gehen und um sprachliches Regelwissen: vor allem zur grammatischen Korrektheit und zur Diskurskonsistenz (Stichwort 'Anaphernresolution im satzübergreifenden Kontext' und dergleichen mehr). Nach einer allgemeinen Einführung zur Thematik und den im Fokus stehenden Aspekten sollen passende Arbeiten aus der Forschung und Entwicklung referiert und diskutiert werden. Eine Übersicht zur Literatur mit möglichen Vortragsthemen wird bis 4 Wochen vor Seminarbeginn im August bekanntgegeben. Interessierte können mir im Vorfeld gerne weitere Titel (per Email) vorschlagen.

Kursübersicht

Seminarplan

Datum Thema Inhalt Materialien
Dienstag
9.15 Einführung Seminarüberblick, Motivation:

Fehlerbeispiele Architektur-bezogen

ISO-Anforderungen Post-Editing

Eberle
11.00 MT-Typen drei MT-Basisarchitekturen Eberle
13.00 MT Qualität Stichproben, Einzelstudien, Fehlertypen Ines Reinig
Mittwoch
9.15 Übersetzungskontext Texttypen, freie Übersetzung, Literarische Übersetzung Hanna Dzhurynska
11.00 Kontrollierte Sprache Samuel Innes
13.00 MT Güteabschätzungen Shared Tasks, Humanbewertung, Güte der Güteabschätzungen Stella Wernicke
Donnerstag
9.15 MT Optimierung Interaktive Verfahren Qiaowen HU
11.00 Integration von Target-Morphologie Jakob Moser
13.00 von ling. Wissen, Terminologie,

Domänenadaptation, Corpora

Blanca Birn
Freitag
9.15 Postediting PE Architekturen, Qualität, Optimierungen Merit Wolfsteiner
11.00 PE u. Tools PE Architekturen, Qualität, Optimierungen, Tools NN
13.00 Demos JoeyNMT-Demo, Beispiele, mögl. Integrationen Mayumi Ohta

Literatur

Eine Liste mit Literatur zu den Sitzungsthemen kann hier heruntergeladen werden.

» weitere Kursmaterialien

zum Seitenanfang