Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Multimodale Semantik

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8 LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8 LP
Magister - -
Dozenten/-innen Gerhard Kremer
Veranstaltungsart Hauptseminar
Erster Termin 22.04.2013
Zeit und Ort Mo, 16:1517:45, INF 327 / SR 2 (SR)
Commitment-Frist 20.05.13.07.2013

Teilnahmevoraussetzungen

  • Vertrautheit mit Statistik und mathematischen Grundlagen der Computerlinguistik
  • Voranmeldung bis 19.04. per E-Mail beim Dozenten

Leistungsnachweis

  • Aktive Teilnahme an den Diskussionen
  • Referat und schriftliche Ausarbeitung

Inhalt

Datengetriebene (vor allem distributionelle) Modelle der Wortbedeutung in der Computerlinguistik beruhten bis vor wenigen Jahren ausschließlich auf großen Textkorpora. Es gibt jedoch gute Gründe, sich nicht alleine auf Text als Wissensquelle zu stützen. Diese kommen sowohl von der kognitiven Seite (Menschen lernen Wortbedeutung selten aus Text allein, sondern Wahrnehmung spielt auch eine wichtige Rolle) als auch von der linguistischen Seite (offensichtliche Informationen wie "Gras ist grün" sind in Korpora schwer zu finden, da sie nicht informativ wären).

Eine neue Forschungsrichtung in der Computerlinguistik hat daher zum Ziel, für die Modellierung von Wortbedeutung auch Information anderer Modalitäten mit einzubeziehen, zum Beispiel menschliches Wissen über Konzept-Merkmale, Assoziationen oder visuelle Information.

Wir werden uns im Seminar mit der Erstellung, dem Umgang und Anwendungen von verschiedenen Bedeutungsrepräsentationen beschäftigen und den Methoden aus der Computerlinguistik, die dabei angewendet werden.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
22.04. Einführung Einf.pdf
29.04. Referatsvergabe, Bewertungskriterien
6.05. McRae, Cree, Seidenberg & McNorgan (2005):
Semantic Feature Production Norms for a Large Set of Living and Nonliving Things
13.05. [Referat: Spaar] ... [Schriftwerk: Kostyra]
Turney & Pantel (2010):
From Frequency to Meaning: Vector Space Models of Semantics
(Schwerpunkt: Abschn. 1 bis inkl. 4.4 und Abschn. 8 & 9)
20.05. Pfingstmontag
27.05. entfällt
3.06. [Referat: Glockner] ... [Schriftwerk: Haider]
Andrews, Vigliocco & Vinson (2009):
Integrating Experiential and Distributional Data to Learn Semantic Representations
(ohne quantitative Analysen, d.h. S. 479-484)
10.06. [Referat: Haider] ...
Silberer & Lapata (2012):
Grounded Models of Semantic Representation
17.06. [Referat: Haas] ... [Schriftwerk: Glockner]
Johns & Jones (2011):
Construction in Semantic Memory: Generating Perceptual Representations With Global Lexical Similarity
24.06. [Referat: Kostyra] ... [Schriftwerk: Haas]
Leong & Mihalcea (2011):
Measuring the Semantic Relatedness Between Words and Images
1.07. [Referat: Pilkevich] ... [Schriftwerk: Ramsl]
Bruni, Boleda, Baroni & Tran (2012):
Distributional Semantics in Technicolor
8.07. [Referat: Feuchtmüller] ... [Schriftwerk: Spaar]
Feng & Lapata (2010):
Visual Information in Semantic Representation
15.07. ... [Schriftwerk: Pilkevich]
Bergsma & Goebel (2011):
Using Visual Information to Predict Lexical Preference
22.07. [Referat: Ramsl] ... [Schriftwerk: Feuchtmüller]
Speriosou, Brown, Moon, Baldridge & Erk (2010):
Connecting Language and Geography With Region-Topic Models

Literatur

Baroni & Lenci (2010): Distributional Memory: A General Framework for Corpus-Based Semantics

Andrews, Vigliocco & Vinson (2009): Integrating Experiential and Distributional Data to Learn Semantic Representations

Bruni, Tran & Baroni (2011): Distributional Semantics From Text and Images

Blei, Ng & Jordan (2003): Latent Dirichlet Allocation

Griffiths, Steyvers, Tenenbaum (2007): Topics in Semantic Representation

Steyvers & Griffiths (2007): Probabilistic Topic Models

Yang, Jiang, Hauptmann & Ngo (2007): Evaluating Bag-of-Visual-Words Representations in Scene Classification

Wing & Baldridge (2011): Simple Supervised Document Geolocation with Geodesic Grids

» weitere Kursmaterialien

zum Seitenanfang