Grammatikinduktion / Grammar Induction
Kursbeschreibung
Dozent | Anette Frank |
Veranstaltungsart | Hauptseminar |
Zeit | Mittwoch, 11:15-12:45 |
Ort | Im Neuenheimer Feld, INF 325, SR 7 |
Studiengang | ABA, MA, Magister |
Modul-Kürzel | ABA: V01 MA: SS-CL1, SS-CL2, SS-FAL |
Leistungsbewertung | ABA: 6 ECTS-Punkte, NBA: 8 ECTS-Punkte |
Teilnahmevoraussetzungen
Programmierprüfung, Kenntnisse in Syntax, insbesondere LFG. Ggf. begleitende Belegung von "Formale Syntax".Leistungsnachweis
Lektüre der zugrundegelegten Literatur, Referat und Hausarbeit oder Referat und ProjektInhalt
Inhalt Seit den 80/90er Jahren wurden linguistisch motivierte und formal wohldefinierte Grammatikformalismen entwickelt, insbesondere Lexical-Functional Grammar (LFG), Combinatory Categorial Grammar (CCG), Head-driven Phrase-Structure Grammar (HPSG) und Lexicalised Tree-Adjoining Grammar(LTAG). Durch die Entwicklung effizienter Parsingalgorithmen ist der Einsatz dieser Grammatikformalismen in computerlinguistischen Anwendungen realistisch geworden. Die Entwicklung umfangreicher manuell definierter Grammatiken ist zeitaufwendig und teuer; für multilinguale Sprachverarbeitung müssen jedoch umfangreiche und robuste Grammatiken in kurzer Zeit entwickelt werden.
Das Seminar führt ein in die Methodik der automatischen Induktion probabilistischer Grammatiken aus Baumbanken am Beispiel von PCFGs. Wir diskutieren insbesondere spezielle Verfahren für die automatische Induktion lexikalisierter und constraint-basierter Grammatiken (wie LFG, TAG, CCG und HPSG) aus angereicherten Baumbanken bzw. Baumbankgrammatiken. Hierbei werden wir die Charakteristiken der jeweiligen Grammatikformalismen und die entsprechenden Unterschiede der entsprechenden Grammatikinduktionsverfahren herausarbeiten. Abschliesslich widmen wir uns neueren Ansätzen für die Grammatikinduktion auf Basis paralleler Korpora.