Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Ableitung von Information aus Texten – Textual Entailment

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010AS-FL8 LP
MasterSS-CL, SS-FAL8 LP
Dozent Kurt Eberle
Veranstaltungsart Hauptseminar
Sprache Deutsch
Erster Termin 02.08.2021
Letzter Termin 06.08.2021
Zeit und Ort Täglich, 10:00-17:00, tba
Commitment-Frist tbd.

Teilnahmevoraussetzungen

Einführung in die Computerlinguistik. Kenntnisse in Logik

Leistungsnachweis

Modalitäten des Scheinerwerbs: Präsentation oder Klausur am Ende des Seminars

Inhalt

Wann folgt ein Text aus einem anderen? In traditioneller formaler Semantik wird das mithilfe semantischer Repräsentationen überprüft: Es werden die Repräsentationen der beiden Texte berechnet, typischerweise im Rahmen einer Montague-grammatischen Modellierung, und dann überprüft, ob die Repräsentation des zweiten Textes formal-logisch aus der des ersten folgt.

Es ist keine neue Erkenntnis, dass Aussagen die Menschen typischerweise aus Texten ableiten oft über das hinausgehen was logische Inferenz liefern kann. Formal-semantisch ist versucht worden, solche Phänomene mit u.a. Abduktion und verschiedenen Default-Logiken zu modellieren.

Seit immer mehr Phänomene in der Computerlinguistik erfolgreich mit Machine Learning (ML) -Ansätzen modelliert werden können, gibt es aber auch entsprechende Verfahren für solche inhaltlichen Ableitungen. In diesem Sinne bedeutet 'Textual Entailment', das menschliche Ableitungsverhalten aus Daten die aus Paaren von (kurzen) Texten und noch kürzeren, daraus ableitbaren oder gerade nicht ableitbaren Aussagen (Hypothesen) bestehen zu lernen.

In dem Seminar wollen wir einen Blick darauf werfen, in welcher Weise semantische Informationen aus Texten abgeleitet und aufeinander bezogen werden können, wobei traditionelle Regel-basierte Verfahren moderneren Daten-getriebenen Verfahren gegenübergestellt werden.

Ausgangspunkt ist eine kurze Wiederholung verschiedener Arten tiefer und flacher Textrepräsentationen und ein Überblick entsprechender Inferenzphänomene. Dann betrachten wir kontrastiv die Erzeugung von semantischen Repräsentationen mit formalen versus ML-Mitteln. Der Hauptteil des Seminars widmet sich danach einer Reihe von Entailment-Ansätzen mit und ohne Repräsentationen, wobei das Gewicht auf neueren ML-basierten Ansätzen liegt.

Das Ziel ist, einen guten Überblick über neuere Arbeiten zum Thema zu gewinnen, auf der Grundlage eines guten formalen Verständnisses der Phänomene.

Kursübersicht

Seminarplan

Montag Folien

Literatur

Literatur wird einige Wochen vor Beginn des Blockkurses bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang