Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Readings in Machine Learning: Semisupervised Learning

Kursbeschreibung

Dozenten/-innen Stefan Riezler
Veranstaltungsart Proseminar
Zeit und Ort Do, 16:15 - 17:45, INF 325 / SR 23a-c (SR)
Studiengang Magister, ABA, NBA
Modul-Kürzel ABA: A13; NBA: CS-CL, BS-CL
Leistungsbewertung ABA: 4 LP

NBA: 6 LP


Teilnahmevoraussetzungen

Grundbegriffe von Statistik und Machine Learning.

Leistungsnachweis

Zu gleichen Teilen:

  • Mündlicher Vortrag
  • Aktive und regelmäßige Teilnahme
  • Schriftliche Ausarbeitung

Inhalt

SSL bezeichnet die Kombination von Supervised Learning  und Unsupervised Learning Techniken in Situationen, wo nur eine kleine Menge von manual annotierten Daten (z.B. Baumbanken), aber eine große Menge von unannotierten Daten (z.B. Texte) verfügbar ist. Da manuelle Datenannotierung kostspielig ist, sind SSL Techniken auf beinahe alle Machine Learning Situationen anwendbar. Erfolgreiches SSL Learning erzielt Ergebnisse vergleichbar zu Supervised Learning, jedoch mit minimalem Aufwand für manuelle Annotierung.

Das Proseminar ist in sich abgeschlossen, und soll weniger fortgeschrittenen Studenten die Möglichkeit bieten, bahnbrechende Arbeiten im Bereich des SSL im Original kennenzulernen. Das Proseminar wird begleitend zur Vorlesung "Introduction to Semisupervised Learning" angeboten, kann aber auch als separate Veranstaltung besucht werden.

Literatur

Als Grundlagenlektüre eignet sich in jedem Fall Steve Abneys Lehrbuch "Semisupervised Learning for Computational Linguistics": http://www.crcpress.com/shopping_cart/products/product_detail.asp?sku=C5599. Eine Liste von Papers wird in der ersten Seminarsitzung bekanntgegeben.

» weitere Kursmaterialien

zum Seitenanfang