Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Cross-Lingual Information Retrieval

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8 LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8LP
Magister - -
Dozenten/-innen Stefan Riezler
Veranstaltungsart Hauptseminar
Erster Termin 22.10.2013
Zeit und Ort Di, 11:1512:45, INF 327 / SR 4 (SR)
Commitment-Frist 02.12.2013 – 17.01.2014

Teilnahmevoraussetzungen

Grundlagen der Wahrscheinlichkeitstheorie und Linearen Algebra, z.B. aus Mathematischem Grundkurs oder Statistical Methods.

Leistungsnachweis

  • Aktive und regelmäßige Teilnahme sowie wöchentliches vorbereitendes Lesen der Papiere
  • Referat inklusive Vorbereitung von Diskussionsfragen

Inhalt

Das Seminar befasst sich mit Methoden des Cross-Lingualen Information Retrieval (CLIR), im Speziellen mit Methoden zur Übersetzung oder Projektion von quellsprachlichen Suchanfragen in die Zielsprache der Dokumente, über die die Suche erfolgen soll. CLIR findet praktische Anwendung in Web-Suche oder Patent-Suche und stellt durch die spezielle Verbindung von automatischer Übersetzung und Retrieval komplexe und interessante Forschungsfragen. Im Seminar sollen verschiedene Zugänge vergleichend untersucht werden.

Mögliche Themenbereiche sind:

  • Direkte Übersetzungsansätze ("das Google Modell")
  • Probabilistic Structured Query Modelle ("SIGIR Modelle")
  • Neueste Machine Learning basierte Ansätze

Kursübersicht

Seminarplan

Meeting Material Referent
22.10. Overview Riezler
29.10. Zhou et al. (2012). Translation Techniques in Cross-Language Information Retrieval. ACM Computing Survey, 45(1), 2012. Chen Li
5.11. Ponte and Croft (1998). A Language Modeling Approach to Information Retrieval. SIGIR'98. Lyubov Nakryyko
12.11. Berger and Lafferty (1999). Information Retrieval as Statistical Translation. SIGIR'99. Angela Schneider
19.11. Xu et al. (2001). Evaluating a Probabilistic Model for Cross-lingual Information Retrieval. SIGIR'01. Jonas Placzek
26.11. Darwish and Oard (2003). Probabilistic Structured Query Methods. SIGIR'03. Patrick Claus
3.12. Ture et al. (2012). Combining Statistical Translation Techniques for Cross-Language Information Retrieval. COLING'12. Mareike Hartmann
10.12. Wu et al. (2008). A Study of Using an Out-Of-Box Commercial MT System for Query Translation in CLIR. iNEWS'08.
Madgy and Jones (2011). An Efficient Method for Using Machine Translation Technologies in Cross-Language Patent Search. CIKM'11.
Matthias Brandt
17.12. Nikoulina et al. (2012). Adaptation of Statistical Machine Translation Model for Cross-Lingual Information Retrieval in a Service Context. EACL'12. Julian Hitschler
7.1. Dumais et al. (1997). Automatic Cross-Language Retrieval Using Latent Semantic Indexing. AAAI-97. Hans-Martin Ramsl
14.1. Guo and Gomes (2009). Ranking Structured Documents: A Large Margin Based Approach for Patent Prior Art Search. IJCAI'09. Frank Marczewski
21.1. -
28.1. Sokolov et al. (2013). Boosting Cross-Language Retrieval by Learning Bilingual Phrase Associations from Relevance Rankings. EMNLP'13. Carolin Haas
4.2. Wrap-up
zum Seitenanfang