Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Automatische Textzusammenfassung

Kursbeschreibung

DozentMichael Strube
VeranstaltungsartProseminar
ZeitDienstag, 16:15-16:45 Uhr
OrtIm Neuenheimer Feld 327, SR 20
StudiengangABA, NBA, Magister
Modul-KürzelABA: A08, NBA: CS-CL, BS-CL, BS-AC
Leistungsbewertung4 ECTS-Punkte


Teilnahmevoraussetzungen

Leistungsnachweis

Aktive Teilnahme, Vortrag/Präsentation und Seminararbeit (max. 10 Seiten)

Inhalt

Die Menge an (online) verfügbarer Information steigt ständig. Suchmaschinen ermöglichen Zugriff auf Dokumentebene. Die automatische Zusammenfassung kann dagegen die verfügbare Information verkürzt und den Interessen des Benutzers entsprechend zu präsentieren.

Im Seminar werden anhand klassischer Arbeiten (aus Mani & Maybury 1999) zunächst die statistischen Methoden eingeführt, die der automatischen Textzusammenfassung zugrundeliegen. Danach soll auf verschiedene Arten der Zusammenfassung eingegangen werden (abstraktiv vs. extraktiv, Multi-document Summarization, Topic-based Summarization, Multimedia-Zusammenfassung, etc.) und auf verschiedene Methoden (rein statistisch, lexikalische Ketten, diskursbasierte Methoden, wissensbasierte Methoden, etc.). Schliesslich soll das Problem der Evaluierung von Methoden automatischer Zusammenfassung diskutiert werden. Hierbei wird die Evaluierung, die im Rahmen der Document Understanding Conference (DUC) durchgeführt wird, eine zentrale Rolle spielen.

Seminarplan mit Literatur (07.07.2008)

Folien: 20080408, 20080415a, 20080415b, 20080422a, 20080422b, 20080429, 20080513, 20080527, 20086003

Literatur

  • Mani, Inderjeet and Maybury, Mark T. (Eds.) (1999). Advances in Automatic Text Summarization. Cambridge, Mass.: MIT Press.
  • Mani, Inderjeet (2001). Automatic Summarization. Amsterdam, The Netherlands: John Benjamins
zum Seitenanfang