Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Text Mining

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Andrea Zielinski
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 19.04.2024
Zeit und Ort Freitags, 10:15-11:45,
INF 327 / SR 4
Commitment-Frist tbd.

Teilnehmerkreis

Für Studierende der Computerlinguistik (ab 25 %)

Teilnahmevoraussetzungen

Grundbegriffe in Statistik

Leistungsnachweis

  • Beteiligung an der Diskussion im Seminar
  • Seminarvortrag
  • Wöchentliche Lektüre von 1-2 Papieren

Inhalt

Im Text Mining werden Data-Mining Verfahren (wie z. Bsp. Klassifikation, Clustering, Trend-Analyse) eingesetzt, um nicht bekannte Informationen in natürlich-sprachlichen Texten aufzufinden.

Das Seminar liefert einen Überblick über das Spektrum der vorhandenen Text Mining Frameworks, stellt deren Architektur vor und diskutiert mögliche Anwendungsgebiete. Themenschwerpunkte des Seminars sind Sentiment- und Polaritätsbestimmung, Topic Modeling und Trendanalyse, sowie die Konstruktion text-basierter Indikatoren, z.B. für die Impact-Messung von wissenschaftlichem Output.

Kursübersicht

Ein Zeitplan und weitere Informationen finden Sie hier.

Literatur

  • Aggarwal, Charu C., and ChengXiang Zhai. Mining text data. Springer, 2012.
  • Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
  • Bing Liu (2011). Web Data Mining. Springer. Second Edition.
  • Ian H. Witten, Eibe Frank, and Mark A. Hall. (2011). Web Data Mining. Springer. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition).
  • Einzelne Publikationen aus der ACL Anthology (ACL, COLING, EMNLP, etc.), Conference and Labs of the Evaluation Forum (CLEF) sowie den SemEval Tracks

Weitere Referenzen werden zu Beginn des Seminars bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang