Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Spielerisch zu neuen Ressourcen

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%|25%] BS-CL, BS-AC 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-CL, BS-AC 4 LP
ABA A13 4 LP
Magister - -
Dozenten/-innen Nils Reiter, Michael Roth
Veranstaltungsart Proseminar
Veranstaltungsbeginn 13.10.2010
Zeit und Ort Mi, 16:1517:45, INF 325 / SR 24 (SR)

Leistungsnachweis

  • Lektüre der zugrundegelegten Literatur
  • Aktive und regelmäßige Teilnahme
  • Ausarbeitung eines Konzeptes für ein Teilprojekt
  • Referat und Hausarbeit

Inhalt

Die Erstellung computerlinguistischer Ressourcen ist teuer und aufwändig. Eine Möglichkeit, um trotzdem auf einfache Weise große Mengen nützlicher Daten zu gewinnen, ist daher, Nutzer im Web einzubeziehen. In diesem Seminar geht es darum, Ideen zu entwickeln, wie dies effektiv gemacht werden kann. Wir wollen verschiedene Ansätze zur Gewinnung von Daten betrachten und uns anschauen, welche Ressourcen so erzeugt werden können. Im zweiten Teil des Seminars sollen Konzepte entwickelt werden, um für bestimmte linguistische Probleme Daten zu sammeln. Beispielsweise könnte eine Spielidee für den Aufbau einer Common-Sense-Ressource erarbeitet werden, die Regelwissen à la „Wenn es regnet, wird die Straße nass“ enthält.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
13.10. Einführung/Themenvorstellung Folien
20.10. How-to Referat Folien
20.10., 18-20 Uhr Adam Kilgariff: Corpora for the coming decade
Vortrag im Rahmes des computerlinguistischen Kolloquiums
Abstract
27.10. Gruppenbildung und Themenverteilung
03.11. Besprechung angekündigter Literatur
  • Hartung and Frank (2010): A Semi-supervised Type-based Classification of Adjectives: Distinguishing Properties and Relations. Proceedings of LREC
  • White (2010): Identifying Sources of Inter-Annotator Variation: Evaluating Two Models of Argument Analysis. Proceedings of the fourth Workshop on Linguistic Annotation
  • Agarwal, Rambow and Passonneau (2010): Annotation Scheme for Social Network Extraction from Text. Proceedings of the fourth Workshop on Linguistic Annotation
10.11. Konsistenz und Evaluation von Annotationen
  • Dligach, Nielsen & Palmer (2010). To Annotate More Accurately or to Annotate More. Proceedings of the Fourth Linguistic Annotation Workshop
  • Bhardwaj, Passonneau, Salleb-Aouissi & Ide (2010). Anveshan: A Framework for Analysis of Multiple Annotators’ Labeling Behavior. Proceedings of the Fourth Linguistic Annotation Workshop
17.11. Gruppe 1: Referat zu Problemstellung
24.11. Gruppe 2: Referat zu Problemstellung Folien
1.12. Vorbesprechung Konzeptentwicklung Tutorial: Functional Specification (PDF), Template (DOC)
8.12.. Gruppe 2: Referat zu Annotationsvorgehen
15.12. Besprechung angekündigter Literatur
12.1. Zwischenberichte
19.1. enfällt
26.1. TBA
2.2. "Abgabe"

Literatur

Zur Literaturliste.

» weitere Kursmaterialien

zum Seitenanfang