Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Einführung in die maschinelle Verarbeitung gesprochener Sprache

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%|25%] BS-CL, BS-AC 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-CL, BS-AC 4 LP
Magister - -
Dozenten/-innen Laura Jehl
Veranstaltungsart Vorlesung
Erster Termin 25.04.2012
Zeit und Ort Mi, 09:1510:45, INF 325 / SR 24 (SR)

Teilnahmevoraussetzungen

Erfolgreiche Teilnahme an den Veranstaltungen "Einführung in die Computerlinguistik" und "Formale Grundlagen"

Leistungsnachweis

  • Durchführung und Dokumentation einer der Praxisübungen
  • Bestehen der Klausur

Inhalt

In dieser Veranstaltung werden wir uns mit den Grundlagen der maschinellen Verarbeitung gesprochener Sprache beschäftigen. Zunächst werden wir uns einen Überblick verschaffen, wie Sprachlaute erzeugt werden, welche Eigenschaften sie haben und wie man sie mithilfe von Spektrogrammen analysieren kann. Anschließend werden wir uns mit den zwei Hauptanwendungen aus dem Bereich der Sprachverarbeitung beschäftigen: Sprachsynthese (Speech Synthesis) und Spracherkennung (Speech Recognition). Ziel ist es sowohl die Theorie hinter diesen Anwendungen zu verstehen, als auch in praktischen Übungen das Gelernte direkt anzuwenden.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
25.4. Einführung; Schallwellen, Spektrum, Spektrogramm, Resonanz
2.5. Erzeugung und Wahrnehmung von Sprache, akustische Phonetik Ladefoged, Kap. 7-9
9.5. Sprachsynthese I - Methoden und Textvorverarbeitung
16.5. Sprachsynthese II - Prosodie, Diphones, TD-PSOLA Jurafsky & Martin, Kap. 8
23.5. Sprachsynthese III - Erzeugung der Wellenform
30.5. TBA
6.6. entfällt wegen Konferenz
13.6. Spracherkennung I - Einführung, Feature Extraktion
20.6. Spracherkennung II - Hidden Markov Models für ASR
27.6. Spracherkennung III - Hidden Markov Models für ASR
4.7. Praxissession
11.7. Spracherkennung IV - kontinuierliche Sprache
18.7. TBA
25.7. Klausur

Literatur

  • P. Ladefoged (1996). Elements of Acoustic Phonetics. Second edition.
  • D. Jurafsky and J. Martin (2009). Speech and Language Processing. Second edition.
  • J. N. Holmes and W. J. Holmes (2001). Speech Synthesis and Recognition.

» weitere Kursmaterialien

zum Seitenanfang