Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Statistisches Parsing

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8 LP
Magister - -
Dozenten/-innen Yannick Versley
Veranstaltungsart Hauptseminar
Erster Termin 21.10.2013
Zeit und Ort Mo, 14:1515:45, INF 327 / SR 3 (SR)
Commitment-Frist 02.12.2013 – 17.01.2014

Teilnahmevoraussetzungen

Grundlagen der Wahrscheinlichkeitstheorie und Linearen Algebra, z.B. aus Mathematischem Grundkurs oder Statistical Methods

Leistungsnachweis

Aktive Teilnahme an den Diskussionen, Referat und schriftliche Ausarbeitung

Inhalt

Text besteht aus mehr als einer Aneinanderreihung einzelner Wörter. Auf der Satzebene besteht der erste Schritt zur weitergehenden Analyse eines Textes in der Identifikation der syntaktischen Struktur (Parsing). Dieses Hauptseminar befasst sich mit dem algorithmischen Unterbau, der dazu notwendig ist, um zum einen aus einem syntaktisch annotierten Korpus (Baumbank) ein statistisches Modell der Satzstruktur zu gewinnen, und zum anderen ein solches Modell effizient anzuwenden, um plausible syntaktische Analysen für unbekannte Sätze zu finden.

Das Seminar soll dabei einen Bogen schlagen zwischen frühen Ansätzen für das Konstituentenparsing mit Baumbankgrammatiken (Charniak 1996) und neueren Ansätzen, die größere Teile der Struktur berücksichtigen (Petrov et al. 2006, Huang 2008).

Kursübersicht

Seminarplan

Datum Sitzung Vortragende/r
21.10.2013Einführung, OrganisationYannick Versley
28.10.2013Baumbankgrammatiken I Danny Rehl (Charniak, 1996)
Yannick Versley (Klein und Manning, 2003a)
4.11.2013Baumbankgrammatiken II David Grimm (Schiehlen 2004)
Chen Li (Dubey 2005)
Ergänzend: Beispiele aus dem Negra-Corpus
11.11.2013Kopflexikalisierung Leseempfehlung: Michael Collins zu Kopflexikalisierung
Yannick Versley (Collins 2003)
18.11.2013Such-Heuristiken Frank Marczewski (Klein und Manning 2003b)
25.11.2013Reranking I Madeline Remse (Charniak und Johnson, 2005)
2.12.2013Latente Variablen Thomas Wangler (Petrov et al. 2006)
9.12.2013Reranking II Mareike Hartmann (Huang 2008)
16.12.2013Self-Training Franziska Hartmann (McClosky et al. 2006; McClosky et al. 2008)
Weihnachten/Neujahr
13.01.2013Parserkombination I Angela Schneider (Sagae und Lavie 2006; Fossum und Knight 2009)
20.1.2013Parserkombination II Chen Li (Petrov 2010)
27.1.2013Parserkombination III Lesegruppe (Le Roux et al. 2013, Huang et al. 2010)
3.2.2013AbschlussZusammenfassung, Organisation

Literatur

Zur Vorbereitung:

  • Manning und Schütze (1999). Probabilistic Context Free Grammars . Kapittel 11 (bis 11.2)
  • Manning und Schütze (1999). Probabilistic Parsing . Kapitel 12 (bis 12.1.5)

Weitere Literatur auf Anfrage bzw. zu Vorlesungsbeginn.

» weitere Kursmaterialien

zum Seitenanfang