Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Natural Language Generation for Virtual Environments

Kursbeschreibung

DozentInnen Michael Roth
Veranstaltungsart Proseminar
Zeit und Ort Mo, 16:15 - 17:45, INF 325 / SR 24 (SR)
Studiengang Magister, NBA, ABA
Modul-Kürzel NBA: CS-CL, BS-CL, AC; ABA: A13
Leistungsbewertung NBA: 6 LP
ABA: 4 LP

Teilnahmevoraussetzungen

Programmierprüfung

Leistungsnachweis

  • Lektüre der zugrundegelegten Literatur
  • Aktive und regelmäßige Teilnahme
  • Referat/Gruppenprojekt
  • Schriftliche Ausarbeitung

Inhalt

Sprachgenerierung (auch Natural Language Generation, kurz NLG, genannt) bezeichnet ein Teilgebiet der Computerlinguistik, das sich mit der sprachlichen Realisierung aus semantischen/logischen Repräsentationen befasst. Dabei kann diese Aufgabe als komplexer Prozess verstanden werden, der aus verschiedenen Teilaufgaben wie beispielsweise Inhalts- und Diskursplanung, Wortwahl und Oberflächenrealisierung besteht.

Dieser Kurs gibt eine Einführung in die Sprachgenerierung mit dem Ziel ein eigenes Generierungssystem zu planen und zu implementieren. In den ersten Wochen des Kurses werden wir ausgewählte Publikationen zur Sprachgenerierung aufarbeiten und diskutieren, um eine Grundlage für den zweiten Kursteil zu legen. Im zweiten Teil wollen wir dann die gewonnenen Einsichten anwenden und in Gruppenarbeit ein System entwickeln, welches sprachliche Anweisungen in virtuellen Umgebungen generieren soll.

Durch die Mitarbeit im Kurs bietet sich die Möglichkeit zur Teilnahme an der GIVE-Challenge, einem international organisierten Wettbewerb von Sprachgenerierungssystemen.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
19.10. Einführung Folien
26.10. Weitere Informationen, Themenverteilung,
ggf. nochmal Besprechung zur Punktevergabe
Folien
2.11. GIVE - Konstantina Garoufi
(Koller et al., 2009; Byron et al., 2009)
Folien
9.11. Content Selection
(Duboue & McKeown, 2003)
Folien
16.11. Discourse Planing - Hartmut Senska
(Barzilay & Lapata, 2005)
Folien
Diskussion
23.11. Lexicalisation - Thomas Wangler
(Bangalore & Rambow, 2000)
Folien
30.11. Referring Expression Generation - Eric Hildebrand
(Dale & Reiter, 1995; Krahmer et al., 2003)
Präsentation
7.12. NLG in GIVE, Implementierungs-Vorbesprechung Folien
14.12. Kurzvortrag Surface Realization, Implementierungs-Vorbesprechung II Folien
21.12. SVN, Trac, Implementierungs-Kickoff SVN-Folien
Trac-Folien
Rest Implementierung, Gruppentreffen
(1.2. Abgabe, letzte Sitzung)

Literatur

  • Bücher/Journal Articles
    • Krahmer, E., van Erk, S. & Verleg, A. (2003). Graph-based Generation of Referring Expressions. Computational Linguistics, 29(1):53-72.
    • Hovy, E. (1990). Pragmatics and natural language generation. Artificial Intelligence, 43(2):153-197.
    • Reiter, E. & Dale, R. (1999). Building Natural Language Generation Systens. Cambridge University Press.
  • Konferenz-Papiere (Auswahl)
    • Barzilay, R. & Lapata, M. (2005). Modeling local coherence: An entity-based approach. In Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL), Ann Arbor, Michigan.
    • Bangalore, S. & Rambow, O. (2000). Corpus-based lexical choice in natural language generation. In Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics (ACL), Hong Kong.
    • Belz, A. (2005). Statistical generation: Three methods compared and evaluated. In Proceedings of the 10th European Workshop on Natural Language Generation (ENLG), Aberdeen, UK.
    • Dale, R. & Reiter, E. (1995). Computational interpretation of the Gricean maxims in the generation of referring expressions. Cognitive Science, 19(2): 233-263.
    • Byron, D., Koller, A., Striegnitz, K., Cassell, J., Dale, R., Moore, J. & Oberlander, J. (2009). Report on the First NLG Challenge on Generating Instructions in Virtual Environments (GIVE). In Proceedings of the 12th European Workshop on Natural Languag Generation (ENLG 2009), Athens.
    • Duboue, P. & McKeown, K. (2003). Statistical acquisition of content selection rules. In Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing (EMNLP), Sapporo, Japan.
    • Koller, A., Byron, D., Cassell, J., Dale, R., Striegnitz, K., Moore, J. & Oberlander, J. (2009). The software architecture for the First Challenge on Generating Instructions in Virtual Environments. In Proceedings of the 12th Conference of the European Chapter of the ACL (Demo Session), Athens.
    • Langkilde, I. (2000). Forest-based statistical sentence generation. In Proceedings of the 1st Conference of the North American Chapter of the Association for Computational Linguistics (NAACL), Seattle, Washington.
  • Links zu weiteren Papieren/Sammlungen von selbigen