Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Einführung in die Sentimentanalyse

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Michael Wiegand
Veranstaltungsart Proseminar
Sprache Deutsch
Zeit und Ort
Einzel: 01.-02.10. Dienstag, 09:00-16:00
INF 325 / SR 24
Mittwoch, 09:00-16:00
INF 325 / SR 24
Erster Termin 01.10.2019
Letzter Termin 25.11.2019
Wöchentlich: Montag, 11:15-12:45
INF 326 / SR 28

Anmerkung

Diese Lehrveranstaltung besteht aus zwei Teilen: einer Blockveranstaltung am 1. und 2. Oktober (9-16Uhr), sowie wöchentliche Sitzungen vom 14. Oktober bis Ende November (Montags 11:15-12:45Uhr).

Fachliche Voraussetzungen

Grundkenntnisse in Linguistik und Computerlinguistik (etwa im Umfang von "Einführung in die Computerlinguistik" und "Einführung in die Sprachwissenschaft").

Auch wünschenswert wäre ein Grundverständnis für überwachtes Lernen ("Supervised Learning") und vor allem Interesse an linguistischer Modellierung.

Leistungsnachweis

- mündlicher Vortrag

- Hausarbeit (d.h. schriftliche Ausarbeitung des Vortrags)

- regelmäßige und aktive Teilnahme

Inhalt

Die Sentimentanalyse hat sich in den letzten Jahren zu einem der aktivsten und produktivsten Forschungsfelder der Computerlinguistik entwickelt. Das Anwendungsfeld ist sehr umfassend und beinhaltet z.B. Zusammenfassung von Produkt- oder Filmkritiken, Trendanalyse auf Twitter oder Vorhersage von Wahlergebnissen durch Erfassen von Onlinekommentaren.Im Seminar soll ein Auszug der existierenden Literatur behandelt werden. Es wird ausschließlich Primärliteratur gelesen.

Folgende Themen werden abgedeckt:

- Erkennung subjektiver Sprache

- Automatische Unterscheidung von Positivität und Negativität

- Extraktion von Opinion Holdern und Opinion Targets

- Erkennung von gefälschten Reviews

- Ironieerkennung

- Erkennung von beleidigender Sprache/Hate Speech

Algorithmisch werden sowohl regelbasierte Methoden als auch überwachte Lernverfahren behandelt.

Die vorgestellten Arbeiten werden einen vorwiegend einen linguistischen Fokus haben.

Kursübersicht

Seminarplan

Datum Sitzung Vortragende(r)
1. Oktober
(9-16 Uhr)
Einführung
Wiederholung: Maschinelles Lernen und Evaluation
Erkennung von Subjektivität: Learning Subjective Adjectives from Corpora/Learning Subjective Nouns using Extraction Pattern Bootstrapping
Wiegand
2. Oktober
(9-16 Uhr)
Wie hält man einen Vortrag
Wie schreibt man eine Hausarbeit
Wiegand
ab 14. Oktober finden die Sitzungen Montags 11:15-12:45Uhr statt
vorläufige Planung!
14. Oktober Polaritätsklassifikation (I): Thumbs up? Sentiment Classification using Machine Learning
oder
Predicting the Semantic Orientation of Adjectives
Studenten
21. Oktober Polaritätsklassifikation (II): Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis Studenten
28. Oktober Rollenextraktion (I): Finding the Sources and Targets of Subjective Expressions Studenten
4. November Rollenextraktion (II): Extracting opinion targets in a single-and cross-domain setting with conditional random fields Studenten
11. November Sarkasmuserkennung (I): ICWSM—a great catchy name: Semi-supervised recognition of sarcastic sentences in online product reviews Studenten
18. November Sarkasmuserkennung (II): Sarcasm as Contrast between a Positive Sentiment and Negative Situation Studenten
25. November Erkennung von Fälschungen: Finding Deceptive Opinion Spam by Any Stretch of the Imagination
oder
Erkennung von Hate Speech: Abusive Language Detection in Online User Content
Studenten

Literatur

J. Wiebe: "Learning Subjective Adjectives from Corpora", in AAAI, 1999. [pdf]

E. Riloff, J. Wiebe, T. Wilson: "Learning Subjective Nouns using Extraction Pattern Bootstrapping", in EMNLP, 2003. [pdf]

V. Hatzivassiloglou, K. R. McKeown: "Predicting the Semantic Orientation of Adjectives", in ACL, 1997. [pdf]

B. Pang, L. Lee, S. Vaithyanathan: "Thumbs up? Sentiment Classification using Machine Learning", in EMNLP, 2002. [pdf]

T. Wilson, J. Wiebe, P. Hoffmann: "Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis", in EMNLP, 2005. [pdf]

N. Jakob, I.Gurevych: "Extracting opinion targets in a single-and cross-domain setting with conditional random fields", in EMNLP, 2010. [pdf]

J. Ruppenhofer, S. Somasundaran, J. Wiebe: "Finding the Sources and Targets of Subjective Expressions", in LREC, 2008. [pdf]

O Tsur, D Davidov, A Rappoport: "ICWSM—a great catchy name: Semi-supervised recognition of sarcastic sentences in online product reviews", in ICWSM, 2010. [pdf]

E. Riloff, A. Qadir, P. Surve, L. De Silva, N. Gilbert, R. Huang: "Sarcasm as Contrast between a Positive Sentiment and Negative Situation", in EMNLP, 2013. [pdf]

M. Ott, Y. Choi, C. Cardie, J. Hancock: "Finding Deceptive Opinion Spam by Any Stretch of the Imagination", in ACL, 2011. [pdf]

C. Nobata, J. Tetreault, A. Thomas. Y. Mehdad, Y. Chang: "Abusive Language Detection in Online User Content", in WWW, 2016. [pdf]

» weitere Kursmaterialien

zum Seitenanfang