Introduction to Machine Learning
Kursbeschreibung
| Dozenten/-innen | Galina Tremper |
| Veranstaltungsart | Proseminar |
| Zeit und Ort | Mo, 16:15 - 17:45, INF 325 / SR 23a-c (SR) |
| Studiengang | ABA, NBA, Magister |
| Modul-Kürzel | ABA: A13; NBA: CS-CL, BS-CL |
| Leistungsbewertung | ABA: 4 LP NBA: 6 LP |
Teilnahmevoraussetzungen
Programmierkenntnisse
Leistungsnachweis
- Regelmäßige und aktive Teilnahme
- Lektüre
- Übungsaufgaben
- Gruppenprojekt
Inhalt
Die Veranstaltung führt in die Grundlagen des maschinellen Lernens ein und dient dazu, erste Kenntnisse über die überwachten und unüberwachten Lernverfahren zu erwerben und praktische Erfahrungen in ihrer Anwendung auf konkrete Problemstellungen zu sammeln. Detaillierter behandelt werden zwei grundlegende Lernverfahren: Entscheidungsbäume und der Naive Bayes Algorithmus. Wir werden die Data-Mining-Software WEKA kennen lernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.
Kursübersicht
Seminarplan
| Datum | Sitzung | Materialien |
| 19.04 | Organisatorisches, Einführung | Folien |
| 26.04 | Klassifikation, Entscheidungsbäume, Overfitting, Pruning | Folien, Übungsblatt 1, Musterlösung 1 |
| 03.05 | Naive Bayes, Smoothing | Folien, Übungsblatt 2 |
| 10.05 | Erste Schritte mit Weka | Folien, Übungsblatt 3 |
| 17.05 | Preprocessing, Filteralgorithmen, Auswahl der Attribute | Folien |
| 31.05 | Inter-annotator Agreement, Evaluierung, Baseline, Lernkurve | Folien |
| 07.06 | Weka als Java-Code | Folien |
| 14.06 | Weka Experiment Environment | Folien |
| 21.06 | Weka Knowledge Flow | Folien |
| 28.06 | Klassifikation von semantischen Relationen zwischen Nomen Schigehiko Schamoni, Isabelle Augenstein |
Folien, Handout |
| 05.07 | Verbklassifikation (Subkategorisierung) Nina Schottmüller, Chen Li Textklassifikation Aysoltan Geldiyeva, Mehmood Riyadh |
Folien 1, Folien 2 |
| 12.07 | Fällt aus wegen ACL-Konferenz |   |
| 19.07 | Named Entity Recognition (NER) Julio Cezar Rodrigues, Hans-Martin Ramsl Word Sense Disambiguation (WSD) Hartmut Senska, Hamdiye Arslan Segmentierung des Diskurses Eric Hildebrand |
Folien 1, Folien 2, Folien 3 |
Literatur
- Tom Mitchell: Machine Learning. McGraw-Hill, 1997.
- Ian Witten and Eibe Frank: Data Mining. Morgan Kaufman, 2005.
- Chris Manning and Hinrich Schütze: Foundations of Statistical Natural Language Processing. MIT Press, 1999.

