Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Text Mining

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-CL, BS-AC 4 LP
Magister - -
Dozenten/-innen Andrea Zielinski
Veranstaltungsart Vorlesung
Erster Termin 25.04.2014
Zeit und Ort Fr, 11:1512:45,
INF 325 / SR 23 (SR)
Commitment-Frist 16.06.13.07.2014

Teilnahmevoraussetzungen

Grundbegriffe in Statistik

Leistungsnachweis

  • Regelmäßige Teilnahme an Vorlesung und Übung
  • Bearbeitung von übungsaufgaben
  • Klausur
  • Aktive Teilnahme an den Veranstaltungen
  • Seminarvortrag (ca. 20 min)

Inhalt

Im Text Mining werden Data-Mining Verfahren (wie z.B. Klassifikation, Clustering, Trend-Analyse) eingesetzt, um nicht bekannte Informationen in natürlich-sprachlichen Texten aufzufinden. Die Vorlesung führt in das Spektrum der vorhandenen Methoden (regelbasiert, wissensbasiert oder statistisch) ein und bietet einen Überblick über mögliche Anwendungsgebiete wie z.B. Social Media Monitoring, Plagiatserkennung sowie Informationsrecherche in den Life Sciences.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
25.04. Introduction to Text Mining s. Wiki
02.05. Information Extraction - NER and Term Extraction s. Wiki
09.05. Relation Detection & Classification s. Wiki
16.05. Vector Space Model s. Wiki
23.05. Classification s. Wiki
30.05. Clustering s. Wiki
06.06. NLP & Twitter Analysis s. Wiki
13.06. Programming with R s. Wiki
20.06.
27.06. Temporal Tagging s. Wiki
04.07. Cross-lingual Text Classification s. Wiki
11.07. Support Vector Machines s. Wiki
18.07. Random Forests
Plagiat Detection, Author Detection, First Story Detection
Question Answering - Watson
s. Wiki
25.07. Klausur

Literatur

  • Christopher D. Manning, Prabhakar Raghavan & Hinrich Schütze (2008). Introduction to Information Retrieval. Cambridge University Press.
  • Bing Liu (2007). Web Data Mining . Springer. Second Edition.
  • Ian H. Witten, Eibe Frank, and Mark A. Hall (2011). Web Data Mining.  Springer
  • Data Mining: Practical Machine Learning Tools and Techniques (Third Edition).
    http://www.cs.waikato.ac.nz/ml/weka/book.html 

» weitere Kursmaterialien

Wiki

zum Seitenanfang