Terminparser-Studienprojekt WS 2001 - WS 2002

Beteiligt waren...

Abstract

Der Terminparser soll in Freiform-Terminankündigungen (vor allem des Unimut) Datumsangaben, Ort und Zeit von Veranstaltungen taggen. Das Ziel ist es, Termine, die in beliebiger Formulierung eingereicht werden, so aufzubereiten, daß sie bestenfalls sofort ins Netz gestellt oder anderweitig weiterverarbeitet werden können. Dabei sollen bestimmte Felder eben mit Datum, Ort und Zeit der Veranstaltung gefüllt werden. (Zusätzlich gibt es die Möglichkeit, Veranstalter zu taggen, die jedoch eher selten fündig wird.)

Wir parsen auf der Grundlage einer problemspezifischen Grammatik auf XML- Basis die POS-getaggte und teilweise semantisch annotierte Eingabe und gewichten gefundene Objekte nach ihrer in der Grammatik festgelegten Relevanz.

Die Ausgabe wird aus den Objekten mit den höchsten Gewichtungen erzeugt. Sie muss direkt von einem Programmodul ausgewertet werden (da die Darstellung XML nicht entspricht und uns andere Formalismen untauglich erschienen).

Zur Vorbereitung bedienten wir uns eines Korpus von Veranstaltungsankündigungen des Unimut.

Grammatik und Übersetzungsmodule sind erweiterbar und können auf andere Probleme angewendet werden.

Projektdateien