Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Introduction to Machine Learning

Kursbeschreibung

Dozenten/-innen	Galina Tremper
Veranstaltungsart	Proseminar
Zeit und Ort	Mo, 16:15 - 17:45, INF 325 / SR 23a-c (SR)
Studiengang	ABA, NBA, Magister
Modul-Kürzel	ABA: A13; NBA: CS-CL, BS-CL
Leistungsbewertung	ABA: 4 LP NBA: 6 LP

Teilnahmevoraussetzungen

Programmierkenntnisse

Leistungsnachweis

Regelmäßige und aktive Teilnahme
Lektüre
Übungsaufgaben
Gruppenprojekt

Inhalt

Die Veranstaltung führt in die Grundlagen des maschinellen Lernens ein und dient dazu, erste Kenntnisse über die überwachten und unüberwachten Lernverfahren zu erwerben und praktische Erfahrungen in ihrer Anwendung auf konkrete Problemstellungen zu sammeln. Detaillierter behandelt werden zwei grundlegende Lernverfahren: Entscheidungsbäume und der Naive Bayes Algorithmus. Wir werden die Data-Mining-Software WEKA kennen lernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.

Kursübersicht

Seminarplan

Datum	Sitzung	Materialien
19.04	Organisatorisches, Einführung	Folien
26.04	Klassifikation, Entscheidungsbäume, Overfitting, Pruning	Folien, Übungsblatt 1, Musterlösung 1
03.05	Naive Bayes, Smoothing	Folien, Übungsblatt 2
10.05	Erste Schritte mit Weka	Folien, Übungsblatt 3
17.05	Preprocessing, Filteralgorithmen, Auswahl der Attribute	Folien
31.05	Inter-annotator Agreement, Evaluierung, Baseline, Lernkurve	Folien
07.06	Weka als Java-Code	Folien
14.06	Weka Experiment Environment	Folien
21.06	Weka Knowledge Flow	Folien
28.06	Klassifikation von semantischen Relationen zwischen Nomen Schigehiko Schamoni, Isabelle Augenstein	Folien, Handout
05.07	Verbklassifikation (Subkategorisierung) Nina Schottmüller, Chen Li Textklassifikation Aysoltan Geldiyeva, Mehmood Riyadh	Folien 1, Folien 2
12.07	Fällt aus wegen ACL-Konferenz
19.07	Named Entity Recognition (NER) Julio Cezar Rodrigues, Hans-Martin Ramsl Word Sense Disambiguation (WSD) Hartmut Senska, Hamdiye Arslan Segmentierung des Diskurses Eric Hildebrand	Folien 1, Folien 2, Folien 3

Literatur

Tom Mitchell: Machine Learning. McGraw-Hill, 1997.
Ian Witten and Eibe Frank: Data Mining. Morgan Kaufman, 2005.
Chris Manning and Hinrich Schütze: Foundations of Statistical Natural Language Processing. MIT Press, 1999.