Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Text Mining

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Andrea Zielinski
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 23.04.2021 (Update!)
Zeit und Ort Freitag, 11:15-12:45, Online
Commitment-Frist tbd.
Hinweis: Aus organisatorischen Gründen muss der Beginn des Kurses um eine Woche verschoben werden. Der erste Termin ist damit der 23. April 2021.

Teilnahmevoraussetzungen

Grundbegriffe in Statistik

Leistungsnachweis

  • Beteiligung an der Diskussion im Seminar
  • Seminarvortrag
  • Wöchentliche Lektüre von 1-2 Papieren

Inhalt

Im Text Mining werden Data-Mining Verfahren (wie z. Bsp. Klassifikation, Clustering, Trend-Analyse) eingesetzt, um nicht bekannte Informationen in natürlich-sprachlichen Texten aufzufinden.

Das Seminar liefert einen Überblick über das Spektrum der vorhandenen Text Mining Frameworks, stellt deren Architektur vor und diskutiert mögliche Anwendungsgebiete. Themenschwerpunkte des Seminars sind Sentiment- und Polaritätsbestimmung, Topic Modeling und Trendanalyse, sowie die Konstruktion text-basierter Indikatoren, z.B. für die Impact-Messung von wissenschaftlichem Output.

Kursübersicht

Seminarplan

Datum Sitzung Materialien

Literatur

  • Aggarwal, Charu C., and ChengXiang Zhai. Mining text data. Springer, 2012.
  • Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
  • Bing Liu (2011). Web Data Mining. Springer. Second Edition.
  • Ian H. Witten, Eibe Frank, and Mark A. Hall. (2011). Web Data Mining. Springer. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition).
  • Einzelne Publikationen aus der ACL Anthology (ACL, COLING, EMNLP, etc.), Conference and Labs of the Evaluation Forum (CLEF) sowie den SemEval Tracks

Weitere Referenzen werden zu Beginn des Seminars bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang