Introduction to Semi-supervised Learning
Kursbeschreibung
Dozenten/-innen | Stefan Riezler |
Veranstaltungsart | Vorlesung/Übung |
Zeit und Ort | Do, 11:15 - 12:45, INF 306 / SR 14 (SR) |
Studiengang | ABA, MA, NBA, Magister |
Modul-Kürzel | ABA: A13; MA: SS-CL, SS-TAL; NBA: CS-CL, BS-CL |
Leistungsbewertung | ABA: 4 LP MA: 8 LP NBA: 6 LP |
Teilnahmevoraussetzungen
Grundbegriffe von Statistik und Machine Learning
Inhalt
Die Vorlesung führt gibt einen einführenden Überblick über Techniken des Semisupervised Learning (SSL). SSL bezeichnet die
Kombination von Supervised Learning und Unsupervised Learning Techniken in Situationen, wo nur eine kleine Menge von manuell
annotierten Daten (z. B. Baumbanken), aber eine große Menge von unannotierten Daten (z. B. Texte) verfügbar ist. Da manuelle
Datenannotierung kostspielig ist, sind SSL Techniken auf beinahe alle Machine Learning Situationen anwendbar. Erfolgreiches
SSL Learning erzielt Ergebnisse vergleichbar zu Supervised Learning, jedoch mit minimalem Aufwand für manuelle Annotierung.
M\"ogliche Themenbereiche der Vorlesung sind
- Self-Training
- Co-Training
- Foundations of Optimization
- Classification
- The Perceptron
- Boosting and Co-Boosting
- Support-Vector Machines and Transductive Learning
- Clustering
- k-means Clustering
- Pseudo-Relevance Feedback
- Label Propagation
Die Vorlesung ist in sich abgeschlossen und für alle Studiengänge und Semester geeignet.
Literatur
Grundlage der Vorlesung ist:
- Steven Abney (2007). Semisupervised Learning for Computational Linguistics. Chapman & Hall/CRC Computer Science & Data Analysis. Hyperlink: "http://www.crcpress.com/shopping_cart/products/product_detail.asp?sku=C5599"