Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Active learning for the acquisition of causal language

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL, AS-FL 8 LP
NBA AS-CL, AS-FL 8 LP
Master SS-CL, SS-FL, SS-TAC 8 LP
Magister - -
Dozenten/-innen Ines Rehbein
Josef Ruppenhofer
Veranstaltungsart Hauptseminar
Erster Termin 03.05.2016
Zeit und Ort Di, 16:1517:45, INF 325 / SR 24 (SR)
Sprechstunde Do, 14:0015:00, INF 325 / 109
Commitment-Frist tbd.

Leistungsnachweis

  • Aktive Teilnahme sowie Lektürevorbereitung mit Fragenerstellung
  • Referat
  • Projekt oder Hausarbeit
Studierende, die ein Referat vorbereiten, sollen ihre Folien in der Woche vor dem Vortrag (spätestens Freitag abend) an die Dozierenden senden, damit wir Feedback geben können. Fragen zum Thema können gerne in der Sprechstunde oder nach Vereinbarung geklärt werden.

Inhalt

Das Seminar beschäftigt sich mit dem Thema Active Learning, einer Methode des halb-überwachten maschinellen Lernens. Active Learning kommt typischwerweise dann zum Einsatz, wenn manuelle Annotation langsam und/oder teuer ist, gleichzeitig aber große Mengen an nicht annotierten Daten zur Verfügung stehen.
Der Erfolg von Active Learning beruht darauf, dass durch das Hinzufügen einer kleinen Menge sorgfältig ausgewählter, manuell annotierter Datenpunkte zu den Trainingsdaten eines maschinellen Lerners der gleiche Lerneffekt erreicht wird wie durch das Trainieren des Lerners auf einer größeren Anzahl an zufällig ausgewählten annotierten Daten. Dadurch können die Kosten der manuellen Annotation oft beträchtlich reduziert werden.
In diesem Kurs lernen wir Anwendungsbeispiele und -varianten von Active Learning kennen und testen die Nützlichkeit von Active Learning bei der Erstellung einer lexikalischen Ressource mit Informationen zu kausaler Sprache.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
03.05.2016 Einführung, Organisatorisches
10.05.2016 Gruppenarbeit
17.05.2016 philosophisches Konzept von Kausalität vs. Kausalität in der Linguistik Copley, Bridget and Wolff, Phillip : Theories of causation can and should inform linguistic theory.
(Julian Hitschler)
24.05.2016 Spielarten von AL/verschiedene Strategien Settles & Craven, EMNLP 2008: An Analysis of Active Learning Strategies for Sequence Labeling Tasks
(Mayumi Ohta)
31.05.2016 Kausalität als Diskursrelation Asr & Demberg. 2012. Implicitness of Discourse Relations.
(Isabell Wolter)
07.06.2016 Kosten-sensitives AL Arora et al. 2009: Estimating Annotation Cost for Active Learning in a Multi-Annotator Environment
(Angelika Kirilin)
Tomanek et al. 2007: An Approach to Text Corpus Construction which Cuts Annotation Costs and Maintains Reusability of Annotated Data
(Catarina Cramer)

Bitte lesen: Settles et al. 2008: Active Learning with Real Annotation Costs
14.06.2016 Modellierung der AnnotatorInnen / Fehlbare Orakel Baldridge & Palmer 2009: How well does active learning actually work? Time-based evaluation of cost-reduction strategies for language documentation
(David Grimm)

Bitte lesen: Rai et al. 2010: Domain Adaptation meets Active Learning
21.06.2016 Modellierung der AnnotatorInnen / Fehlbare Orakel Donmez et al. 2009: Efficiently Learning the Accuracy of Labeling Sources for Selective Sampling
(Juri Opitz)
Sheng et al. 2008: Get Another Label? Improving Data Quality and Data Mining Using Multiple, Noisy Labelers
(Raphael Schumann)
28.06.2016 AL Toolkit: Dualist Settles 2011: Closing the Loop: Fast, Interactive Semi-Supervised Annotation with Queries on Features and Instances
Settles & Zhu 2012: Behavioral Factors in Interactive Training of Text Classifiers
05.07.2016 Kausalität als Teil von Verbbedeutung Girju 2003: Automatic Detection of Causal Relations for Question Answering
(Sebastian Burst)

Bitte lesen: Mirza and Tonelli (2014): An Analysis of Causality between Events and its Relation to Temporal Information
12.07.2016 Kausale Sprache / Konstruktikon Dunietz et al. 2015: Annotating Causal Language Using Corpus Lexicography of Constructions
(Atilla Azgin)
19.07.2016 Querying features instead of instances Attenberg et al 2010: Guided Feature Labeling for Budget-Sensitive Learning Under Extreme Class Imbalance
(Felix Krauss)
26.07.2016 Wrap-up Bitte lesen: Attenberg and Provost (2010): Inactive Learning? Difficulties Employing Active Learning in Practice

Literatur

  • Burr Settles. Active Learning. Synthesis Lectures on Artificial Intelligence and Machine Learning. Morgan & Claypool, 2012.
  • Dunietz, Jesse, Lori Levin, and Jaime Carbonell. "Annotating Causal Language Using Corpus Lexicography of Constructions." The 9th Linguistic Annotation Workshop held in conjuncion with NAACL 2015.

Weitere Literatur wird am Anfang des Kurses bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang