Automatische Textzusammenfassung
Kursbeschreibung
Dozent | Michael Strube |
Veranstaltungsart | Proseminar |
Zeit | Dienstag, 16:15-16:45 Uhr |
Ort | Im Neuenheimer Feld 327, SR 20 |
Studiengang | ABA, NBA, Magister |
Modul-Kürzel | ABA: A08, NBA: CS-CL, BS-CL, BS-AC |
Leistungsbewertung | 4 ECTS-Punkte |
Teilnahmevoraussetzungen
Leistungsnachweis
Aktive Teilnahme, Vortrag/Präsentation und Seminararbeit (max. 10 Seiten)
Inhalt
Die Menge an (online) verfügbarer Information steigt ständig. Suchmaschinen ermöglichen Zugriff auf Dokumentebene. Die automatische Zusammenfassung kann dagegen die verfügbare Information verkürzt und den Interessen des Benutzers entsprechend zu präsentieren.
Im Seminar werden anhand klassischer Arbeiten (aus Mani & Maybury 1999) zunächst die statistischen Methoden eingeführt, die der automatischen Textzusammenfassung zugrundeliegen. Danach soll auf verschiedene Arten der Zusammenfassung eingegangen werden (abstraktiv vs. extraktiv, Multi-document Summarization, Topic-based Summarization, Multimedia-Zusammenfassung, etc.) und auf verschiedene Methoden (rein statistisch, lexikalische Ketten, diskursbasierte Methoden, wissensbasierte Methoden, etc.). Schliesslich soll das Problem der Evaluierung von Methoden automatischer Zusammenfassung diskutiert werden. Hierbei wird die Evaluierung, die im Rahmen der Document Understanding Conference (DUC) durchgeführt wird, eine zentrale Rolle spielen.
Seminarplan mit Literatur (07.07.2008)
Folien: 20080408, 20080415a, 20080415b, 20080422a, 20080422b, 20080429, 20080513, 20080527, 20086003
Literatur
- Mani, Inderjeet and Maybury, Mark T. (Eds.) (1999). Advances in Automatic Text Summarization. Cambridge, Mass.: MIT Press.
- Mani, Inderjeet (2001). Automatic Summarization. Amsterdam, The Netherlands: John Benjamins