Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Advanced Programming for Computational Linguistics

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-CL 8 LP
NBA AS-CL 8 LP
Master SS-CL, SS-TAC 8 LP
Magister - -
Dozenten/-innen Schigehiko Schamoni
Veranstaltungsart Vorlesung/Übung
Erster Termin 22.04.2013
Zeit und Ort Mo, 11:1512:45, INF 325 / SR 7 (SR) und INF 350 (OMZ), R U011 (CIP-Pool IWR), How to find the IWR pool
Commitment-Frist 20.05.13.07.2013

Teilnahmevoraussetzungen

Programmieren 1 (P I) und 2 (PII) oder äquivalente Programmiererfahrung.

Voranmeldung per Mail an den Dozenten!

Leistungsnachweis

Regelmäßige Teilnahme und Bearbeitung von Übungsaufgaben.

Bearbeitung eines Programmierprojekts.

Inhalt

Die Veranstaltung richtet sich an Studierende der Computerlinguistik mit Interesse an modernen Programmierparadigmen für parallele Rechnerarchitekturen. Die Teilnehmer erfahren an Praxisbeispielen welche Probleme mit welchen Ansätzen gelöst werden können, und optimieren Algorithmen für parallele und verteilte Datenverarbeitung.

Der Kurs behandelt folgende Themen:

  • Grundbegriffe Rechnerarchitekturen und Netzwerke
  • Aufbau von parallelen Rechnersystemen
  • Einführung in die Programmiersprache C/C++ für maschinennahe Programmierung
  • Data- und Thread-Level Parallelism, Warehouse-Scale Computing
  • Problemlösungen mit OpenMP, MPI und insbesondere Hadoop
  • Schwerpunkt Machine Learning, Big Data Processing

Kursübersicht

Seminarplan

Datum Ort Sitzung Materialien
22.04. SR7 Introduction, Computer Architectures intro, session 1, homework 1
29.04. CIP-Pool IWR-Pool, C++ Overview, Perceptron session 2, homework 2
06.05. CIP-Pool Parallel Computing, Architectures and Algorithms (I) session 3
13.05. SR7 Architectures and Algorithms (I) cont'd homework 3
27.05. CIP-Pool Recap, Discussion of Homework redo HW 3
03.06. SR7 Parallel Computing, Architectures and Algorithms (II) cont'd homework 4
10.06. CIP-Pool Architectures and Algorithms (II) cont'd session 4
17.06. SR7 Analysis of Parallel Algorithms session 5, homework 5
24.06. CIP-Pool Big Data Processing, MapReduce (I) session 6, homework 6
01.07. SR7 MapReduce (II), MR Algorithm Design session 7a, session 7b, homework 7
08.07. CIP-Pool Information Retrieval and MapReduce Implementations (I) session 8, homework 8
15.07. SR7 Information Retrieval and MapReduce Implementations (II) session 9
22.07. CIP-Pool Discussion of Projects, Machine Learning with Mahout list of projects

Literatur

  • Abney (2008): Semisupervised Learning for Computational Linguistics. Chapman & Hall/CRC.
  • Lin and Dyer (2010): Data-Intensive Text Processing with MapReduce. Morgan & Claypool.
  • Hennesey and Patterson (2011): Computer Architectures - A Quantitative Approach (5th Edition). Elsevier, Morgan Kaufmann.
  • Bekkerman, Bilenko, Langford (eds.) (2011): Scaling up Machine Learning. Cambridge University Press.

Weitere Literatur wird zu Beginn der Veranstaltung bekannt gegeben.

» weitere Kursmaterialien

zum Seitenanfang