Einführung in die maschinelle Verarbeitung gesprochener Sprache
Kursbeschreibung
| Studiengang | Modulkürzel | Leistungs- bewertung |
|---|---|---|
| BA-2010[100%|75%] | CS-CL | 6 LP |
| BA-2010[50%|25%] | BS-CL, BS-AC | 4 LP |
| NBA[100%|75%] | CS-CL | 6 LP |
| NBA[50%|25%] | BS-CL, BS-AC | 4 LP |
| Magister | - | - |
| Dozenten/-innen | Laura Jehl |
| Veranstaltungsart | Vorlesung |
| Erster Termin | 25.04.2012 |
| Zeit und Ort | Mi, 09:15–10:45, INF 325 / SR 24 (SR) |
Teilnahmevoraussetzungen
Erfolgreiche Teilnahme an den Veranstaltungen "Einführung in die Computerlinguistik" und "Formale Grundlagen"
Leistungsnachweis
- Durchführung und Dokumentation einer der Praxisübungen
- Bestehen der Klausur
Inhalt
In dieser Veranstaltung werden wir uns mit den Grundlagen der maschinellen Verarbeitung gesprochener Sprache beschäftigen. Zunächst werden wir uns einen Überblick verschaffen, wie Sprachlaute erzeugt werden, welche Eigenschaften sie haben und wie man sie mithilfe von Spektrogrammen analysieren kann. Anschließend werden wir uns mit den zwei Hauptanwendungen aus dem Bereich der Sprachverarbeitung beschäftigen: Sprachsynthese (Speech Synthesis) und Spracherkennung (Speech Recognition). Ziel ist es sowohl die Theorie hinter diesen Anwendungen zu verstehen, als auch in praktischen Übungen das Gelernte direkt anzuwenden.
Kursübersicht
Seminarplan
| Datum | Sitzung | Materialien |
| 25.4. | Einführung; Schallwellen, Spektrum, Spektrogramm, Resonanz | |
| 2.5. | Erzeugung und Wahrnehmung von Sprache, akustische Phonetik | Ladefoged, Kap. 7-9 |
| 9.5. | Sprachsynthese I - Methoden und Textvorverarbeitung | |
| 16.5. | Sprachsynthese II - Prosodie, Diphones, TD-PSOLA | Jurafsky & Martin, Kap. 8 |
| 23.5. | Sprachsynthese III - Erzeugung der Wellenform | |
| 30.5. | TBA | |
| 6.6. | entfällt wegen Konferenz | |
| 13.6. | Spracherkennung I - Einführung, Feature Extraktion | |
| 20.6. | Spracherkennung II - Hidden Markov Models für ASR | |
| 27.6. | Spracherkennung III - Hidden Markov Models für ASR | |
| 4.7. | Praxissession | |
| 11.7. | Spracherkennung IV - kontinuierliche Sprache | |
| 18.7. | TBA | |
| 25.7. | Klausur |
Literatur
- P. Ladefoged (1996). Elements of Acoustic Phonetics. Second edition.
- D. Jurafsky and J. Martin (2009). Speech and Language Processing. Second edition.
- J. N. Holmes and W. J. Holmes (2001). Speech Synthesis and Recognition.

