Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Introduction to Machine Learning

Kursbeschreibung

Dozenten/-innen Galina Tremper
Veranstaltungsart Proseminar
Zeit und Ort Mo, 16:15 - 17:45, INF 325 / SR 23a-c (SR)
Studiengang ABA, NBA, Magister
Modul-Kürzel ABA: A13; NBA: CS-CL, BS-CL
Leistungsbewertung ABA: 4 LP

NBA: 6 LP


Teilnahmevoraussetzungen

Programmierkenntnisse

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Lektüre
  • Übungsaufgaben
  • Gruppenprojekt

Inhalt

Die Veranstaltung führt in die Grundlagen des maschinellen Lernens ein und dient dazu, erste Kenntnisse über die überwachten und unüberwachten Lernverfahren zu erwerben und praktische Erfahrungen in ihrer Anwendung auf konkrete Problemstellungen zu sammeln. Detaillierter behandelt werden zwei grundlegende Lernverfahren: Entscheidungsbäume und der Naive Bayes Algorithmus. Wir werden die Data-Mining-Software WEKA kennen lernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
19.04 Organisatorisches, Einführung Folien
26.04 Klassifikation, Entscheidungsbäume, Overfitting, Pruning Folien, Übungsblatt 1, Musterlösung 1
03.05 Naive Bayes, Smoothing Folien, Übungsblatt 2
10.05 Erste Schritte mit Weka Folien, Übungsblatt 3
17.05 Preprocessing, Filteralgorithmen, Auswahl der Attribute Folien
31.05 Inter-annotator Agreement, Evaluierung, Baseline, Lernkurve Folien
07.06 Weka als Java-Code Folien
14.06 Weka Experiment Environment Folien
21.06 Weka Knowledge Flow Folien
28.06 Klassifikation von semantischen Relationen zwischen Nomen
Schigehiko Schamoni, Isabelle Augenstein
Folien, Handout
05.07 Verbklassifikation (Subkategorisierung)
Nina Schottmüller, Chen Li
Textklassifikation
Aysoltan Geldiyeva, Mehmood Riyadh
Folien 1, Folien 2
12.07 Fällt aus wegen ACL-Konferenz  
19.07 Named Entity Recognition (NER)
Julio Cezar Rodrigues, Hans-Martin Ramsl
Word Sense Disambiguation (WSD)
Hartmut Senska, Hamdiye Arslan
Segmentierung des Diskurses
Eric Hildebrand
Folien 1, Folien 2, Folien 3

Literatur

  • Tom Mitchell: Machine Learning. McGraw-Hill, 1997.
  • Ian Witten and Eibe Frank: Data Mining. Morgan Kaufman, 2005.
  • Chris Manning and Hinrich Schütze: Foundations of Statistical Natural Language Processing. MIT Press, 1999.

» weitere Kursmaterialien

zum Seitenanfang