Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Advanced Programming (P III)

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8 LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8 LP
Dozenten/-innen Shigehiko Schamoni
Veranstaltungsart Vorlesung/Übung
Erster Termin 20.04.2015
Zeit und Ort Mo, 11:1512:45, INF 350 (OMZ) / U011 (IWR-Pool)
Commitment-Frist 16.06.15.07.2015

Teilnahmevoraussetzungen

Programmieren 1 (P I), Programmieren 2 (P II) und Statistische Methoden.

Voranmeldung per Mail an den Dozenten.

Leistungsnachweis

Regelmäßige Teilnahme und Bearbeitung von Übungsaufgaben. Implementierung und Dokumentation eines Abschlussprojektes.

Inhalt

Die Veranstaltung richtet sich an Studierende der Computerlinguistik mit Interesse an der Verarbeitung und Analyse großer Textkorpora, oft in Verbindung mit Machine Learning Methoden.

Die Teilnehmer lernen an Praxisbeispielen verschiedene Lösungsansätze kennen und optimieren Algorithmen für parallele und verteilte Datenverarbeitung.

Der Kurs behandelt folgende Themen:

  • Rechnerarchitekturen und Netzwerke, Aufbau paralleler Rechnersysteme
  • Maschinennahe Programmierung in C/C++
  • Data- und Thread-Level Parallelism, Warehouse-Scale Computing
  • Problemlösungen mit OpenMP, MPI und Hadoop
  • Machine Learning auf modernen Architekturen

Kursübersicht

Seminarplan

Datum Sitzung Materialien
20.04. Introduction, Computer Architectures Intro, Slides01
27.04. C++ Introduction, Conceps, Overview Slides02, Homework01
04.05. Practical Session Homework02
11.05. Parallel Computing, Architectures and Algorithms (I) Slides03, Homework03
18.05. Parallel Computing, Architectures and Algorithms (II) Slides04
25.05. Pfingstmontag
01.06. Applications (I) Homework04
08.06. Applications (II) Slides05
15.06. Scalability of Parallel Algorithms Slides06
22.06. Big Data Processing, MapReduce Slides07, 07-2, Homework05
29.06. MapReduce Algorithm Design Slides08
06.07. Information Retrieval and MapReduce Implementations (I) Slides09, Homework06
13.07. Information Retrieval and MapReduce Implementations (II) Slides10
20.07. Fällt leider aus – Dozent ist nicht da
27.07. ?

Literatur

  • Abney (2008): Semisupervised Learning for Computational Linguistics. Chapman & Hall/CRC.
  • Lin and Dyer (2010): Data-Intensive Text Processing with MapReduce. Morgan & Claypool.
  • Hennesey and Patterson (2011): Computer Architectures - A Quantitative Approach (5th Edition). Elsevier, Morgan Kaufmann.
  • Murphy (2012): Machine Learning: a Probabilistic Perspective. MIT Press.
  • Bekkerman, Bilenko, Langford (eds.) (2011): Scaling Up Machine Learning. Cambridge University Press.

Weitere Literatur wird zu Beginn der Veranstaltung bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang