
Text Mining
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010[100%|75%] | CS-CL | 6 LP |
BA-2010[50%] | BS-CL | 6 LP |
BA-2010[25%] | BS-AC | 4 LP |
NBA[100%|75%] | CS-CL | 6 LP |
NBA[50%|25%] | BS-CL, BS-AC | 4 LP |
Magister | - | - |
Dozenten/-innen | Andrea Zielinski |
Veranstaltungsart | Vorlesung |
Erster Termin | 25.04.2014 |
Zeit und Ort | Fr, 11:15–12:45, INF 325 / SR 23 (SR) |
Commitment-Frist | 16.06.–13.07.2014 |
Teilnahmevoraussetzungen
Grundbegriffe in Statistik
Leistungsnachweis
- Regelmäßige Teilnahme an Vorlesung und Übung
- Bearbeitung von übungsaufgaben
- Klausur
- Aktive Teilnahme an den Veranstaltungen
- Seminarvortrag (ca. 20 min)
Inhalt
Im Text Mining werden Data-Mining Verfahren (wie z.B. Klassifikation, Clustering, Trend-Analyse) eingesetzt, um nicht bekannte Informationen in natürlich-sprachlichen Texten aufzufinden. Die Vorlesung führt in das Spektrum der vorhandenen Methoden (regelbasiert, wissensbasiert oder statistisch) ein und bietet einen Überblick über mögliche Anwendungsgebiete wie z.B. Social Media Monitoring, Plagiatserkennung sowie Informationsrecherche in den Life Sciences.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
25.04. | Introduction to Text Mining | s. Wiki |
02.05. | Information Extraction - NER and Term Extraction | s. Wiki |
09.05. | Relation Detection & Classification | s. Wiki |
16.05. | Vector Space Model | s. Wiki |
23.05. | Classification | s. Wiki |
30.05. | Clustering | s. Wiki |
06.06. | NLP & Twitter Analysis | s. Wiki |
13.06. | Programming with R | s. Wiki |
20.06. | ||
27.06. | Temporal Tagging | s. Wiki |
04.07. | Cross-lingual Text Classification | s. Wiki |
11.07. | Support Vector Machines | s. Wiki |
18.07. | Random Forests Plagiat Detection, Author Detection, First Story Detection Question Answering - Watson |
s. Wiki |
25.07. | Klausur |
Literatur
- Christopher D. Manning, Prabhakar Raghavan & Hinrich Schütze (2008). Introduction to Information Retrieval. Cambridge University Press.
- Bing Liu (2007). Web Data Mining . Springer. Second Edition.
- Ian H. Witten, Eibe Frank, and Mark A. Hall (2011). Web Data Mining. Springer
-
Data Mining: Practical Machine Learning Tools and Techniques (Third Edition).
http://www.cs.waikato.ac.nz/ml/weka/book.html