Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Computerlinguistik

Inhalt des Studiums
Aufbau des Studiums
Schwerpunkte der Forschung/Lehre
Formalia
Fachstudienberatung
Kontakt
Studienabschluss: Master of Arts
(ab WS 07/08)

Bachelor of Arts

Bewerbungspflichtig: Ja
Nein
Studienbeginn: Wintersemester
Winteresemester
Regelstudienzeit:4 Semester
6 Semester
Sprachnachweise: Kenntnisse der englischen Fachsprache und einer weiteren modernen Fremdsprache
Lehrsprache: Deutsch Deutsch

Inhalt des Studiums

Computerlinguistik ist ein interdisziplinäres Fach. Es untersucht, wie natürliche Sprache durch formale Modellierung, algorithmische Verfahren der Informatik und statistische Verfahren automatisch verarbeitet und interpretiert werden kann. Neben der forschungstheoretischen Seite der Computerlinguistik, die die formalen (mathematischen und logischen) Eigenschaften der natürlichen Sprache und ihre Umsetzung in effiziente Algorithmen erforscht, hat die Computerlinguistik auch eine stark anwendungsorientierte Ausrichtung.

Beispiele für bereits existierende und mögliche Anwendungen der Computerlinguistik finden sich in vielen Bereichen unserer modernen Gesellschaft, wie z. B.:

  • Unterstützung beim Übersetzen von Texten in eine andere Sprache oder vollständig automatische Übersetzung (Maschinelle Übersetzung).
  • Die automatische Aufbereitung und Erschließung großer Datenbasen sprachlich vorliegender Informationen, z. B. durch automatische Erstellung von Zusammenfassungen und Abstracts (Summarization), oder das Auffinden gezielter Informationen in großen Mengen wissenschaftlicher Publikationen (e-Science).
  • Das Auffinden von Informationen in heterogenen Datenquellen: z. B. dem Internet, großen strukturierten Datenbanken, oder umfangreichen Firmenportalen.
  • Die automatische Beantwortung von Fragen auf der Basis großer Datenbanken oder der sprachlichen Informationen im World-Wide Web.
  • Schließlich auch Sprachlern- bzw. Korrekturprogramme für Fremdsprachenlerner, wie z. B. Vokabeltrainer und andere Übungsprogramme, sowie auch Korrekturprogramme für Rechtschreibung und Grammatik für Muttersprachler in Texteditoren.
  • Sprachliche Interaktion mit Computern oder intelligenten Systemen sogenannter Künstlicher Intelligenz im Bereich von Robotik, virtuellen Welten oder der maschinell unterstützenden medizinischen Versorgung.

Neben ihren praktischen Anwendungen beschäftigt sich die Computerlinguistik mit vielfältigen Forschungsfragen, die sich aus den verschiedenen Aspekten der formalen und algorithmischen Perspektive auf das Phänomen Sprache ergeben:

Die Sprachen der Welt haben viele gemeinsame, aber auch viele unterschiedliche Strukturprinzipien, die die maschinell verarbeitenden Systeme der Computerlinguistik darstellen (repräsentieren), erkennen und verarbeiten können müssen. Eine Forschungsfrage der Computerlinguistik ist daher, ob bzw. in welchem Maße die Sprachen der Welt auf Basis eines uniformen formalen Grammatikformalismus modelliert und mit computerlinguistischen Algorithmen effizient verarbeitet werden können. Die Frage der kognitiven Adäquatheit solcher Formalismen kann z. B. durch sprachpsychologische Experimente erforscht werden. Die theoretisch orientierte Computerlinguistik widmet sich insbesondere der Frage, welche Aspekte des Sprachsystems durch welche formalen Beschreibungskonstrukte bzw. Algorithmen dargestellt und verarbeitet werden können. Die Computerlinguistik hat als formale Wissenschaft eine stark empirische Seite: durch die Formalisierung und Implementierung der computerlinguistischen Modelle und ihre Anwendung auf sprachliche Daten können ihre Vorhersagen empirisch überprüft und evaluiert werden.

Die Anwendungen der Computerlinguistik sowie ihre Beziehung zu Nachbarwissenschaften sind geprägt durch die Natur und Funktionsweise natürlicher Sprache. Sprache dient vornehmlich der Interaktion und der Kommunikation von Inhalten. Genau wie die menschliche Sprachverwendung ist auch die maschinelle Sprachverarbeitung mit den Barrieren der Vielfalt natürlicher Sprachen konfrontiert. Die Frage wie die Verarbeitung von Sprache bis hin zur Repräsentation des entsprechenden Wissens zu beschreiben ist, beschäftigt die Computerlinguistik in ihren Berührungspunkten zur Künstlichen Intelligenz, der Kognitionswissenschaften und der Pyschologie.

Die Computerlinguistik verbindet die sprachwissenschaftlich motivierte Erforschung des Phänomens Sprache mit exakten Methoden formaler Modellierung und ihrer Umsetzung in algorithmischen und statistischen Verfahren sowie der empirischen Überprüfung ihrer Theorien und Verfahren durch experimentelle Methoden, d.h. durch die Anwendung ausführbarer Programme auf reale Sprachdaten in kontrollierten oder realen Anwendungen.

Voraussetzungen für das Studium

Computerlinguistik ist ein interdisziplinäres Fach. Es erfordert Kenntnisse in Informatik und in Linguistik, sowie die Fähigkeit, diese Kenntnisse auf spezifische Weise verbinden zu können, um ein Problem der maschinellen Sprachverarbeitung theoretisch und praktisch lösen zu können. Das Studium der Computerlinguistik in Heidelberg besteht daher auch aus drei Studiengebieten:

  • Informatik und Programmierpraxis
  • Theoretische und empirische Grundlagen der Formalen Linguistik
  • Algorithmische Linguistik: der Kernbereich der theoretischen und angewandten Computerlinguistik

In allen drei Gebieten müssen Studienleistungen erbracht werden, alle drei werden im Examen geprüft. Informatik und Linguistik liefern die Voraussetzungen, die Algorithmisierung linguistischer Sachverhalte ist der genuine Bereich der Computerlinguistik.

Eine gute Voraussetzung für das Studium der Computerlinguistik ist Interesse sowohl an Sprache wie an Mathematik und Informatik. Notwendig ist eine eher seltene Kombination von geisteswissenschaftlicher Sensibilität und naturwissenschaftlich-mathematischer Begabung. Wer sich für eine dieser beiden Seiten wenig interessiert, sollte lieber Philologe bzw. Informatiker werden.

Theorie und Praxis sind in der Computerlinguistik eng aufeinander bezogen, da theoretische Einsichten in lauffähige Programme überführt werden sollen. Deshalb hat die Computerlinguistik teilweise einen ingenieurmäßigen Charakter. Das Besondere an der Computerlinguistik ist die Algorithmisierung der Linguistik. Während man die Benutzung eines Computers lernen kann, während der empirische Linguist schlicht herausfindet, wie die Sprache beschaffen ist, muss der Computerlinguist einen Algorithmus oder ein statistisches Modell entwerfen, um die gewünschten Resultate zu erzielen. Lernen, Forschen und Erfinden bestimmen also das Tätigkeitsfeld des Computerlinguisten. Schließlich ist viel Ausdauer erforderlich. Programmieren braucht viel Zeit. Bis ein Programm fehlerfrei läuft, vergehen oft viele Stunden. Auch führen die empirischen Experimente nicht immer zum gewünschten Ergebnis. Und da die Computerlinguistik eine exakte Wissenschaft ist, gibt es an den Ergebnissen meist nichts zu deuteln, sondern es hilft nur, die Theorie, den Algorithmus oder das Verfahren zu verbessern und neu zu evaluieren.

Studiengänge

Studienmöglichkeiten. Die Einschreibung für den Magisterstudiengang Computerlinguistik war letztmalig zum SS 2007 möglich und wird nun vollkommen durch die Bachelor- (BA) und Masterstudiengänge (MA) Computerlinguistik ersetzt.

Bachelor-und Masterstudiengänge Computerlinguistik. Zum Wintersemester 2007/08 wird der BA-Studiengang Computerlinguistik als Hauptfach (75%), 2. Hauptfach (50%) und als Beifach (25%) angeboten. Für die zuvor gültige BA-Prüfungsordnung gibt es eine Übergangsregelung. Erstmals zum WS 2007/08 wird ein konsekutiver Masterstudiengang Computerlinguistik angeboten. Die Einschreibung für sowohl den BA- als auch den MA-Studiengang erfolgt in der Regel nur zum Wintersemester. Für den MA-Studiengang gibt es ein Zulassungsverfahren.

 

Inhalte und Aufbau des Studiums

Die Inhalte des interdisziplinären Fachs verteilen sich auf drei Fachbereiche: informatische, linguistische und computerlinguistische Grundlagen. Die Modularisierungsübersichten zu den BA- und MA-Studiengängen Computerlinguistik (erstmals gültig zum WS 2007/2008) erläutern die wesentlichen Inhalte. Detaillierte Informationen zu den einzelnen Modulen können auf den Webseiten des Seminars für Computerlinguistik eingesehen werden (www.cl.uni-heidelberg.de).

Die thematischen Schwerpunkte des Fachs sind gegliedert in die folgenden Teilbereiche:

Teilbereiche der Theoretischen Computerlinguistik

  • Automatentheorie
  • Graphentheorie
  • Inferenzverfahren
  • Linguistische Repräsentationsformalismen
  • Maschinelle Lernverfahren
  • Formale Sprachen und Grammatikformalismen
  • Methoden statistischer Sprachverarbeitung
  • Methoden der algorithmischen Sprachverarbeitung
  • weitere verwandte Gebiete


Teilbereiche der Angewandten Computerlinguistik

  • Informationsextraktion
  • Information Retrieval
  • Maschinelle Übersetzung
  • Frage-Antwort-Systeme
  • Dialogsysteme
  • Lernende Systeme
  • Natural Language Understanding
  • Künstliche Intelligenz und Wissensrepräsentation
  • Phonetik
  • Spracherkennung und -synthese
  • Spezialthemen der algorithmischen Verarbeitung
  • weitere verwandte Gebiete


Teilbereiche der Formalen Linguistik

  • Linguistische Grammatiktheorien
  • Spezialthemen der formalen Syntax, Semantik, Diskurs- und Dialogsemantik, Pragmatik, Morphologie und Phonologie
  • weitere verwandte Gebiete


Teilbereiche der Angewandten Linguistik

  • Sprachlernsysteme
  • Induktion, Akquisition und formale Repräsentation linguistischer Ressourcen
  • Kognitive Linguistik
  • Kontrastive Linguistik
  • Korpuslinguistik
  • weitere verwandte Gebiete

Forschungsumfeld der Computerlinguistik in Heidelberg

Es gibt in Heidelberg drei geisteswissenschaftliche Fakultäten mit verschiedenen interessanten sprachwissenschaftlichen Forschungsschwerpunkten. Die Sprachwissenschaft in Heidelberg ist beispielsweise führend im Bereich der Lexikografie, einem Gebiet, das auch als Anwendungsperspektive für die Computerlinguistik in Frage kommt. Darüber hinaus ist die Computerlinguistik naturgemäß mit der Informatik verknüpft. In Heidelberg existiert einerseits eine (noch junge) Fakultät für Informatik und andererseits eine „verteilte Informatik“, die sich aus der Einbettung der Informatik in bestimmte Anwendungsfächer, wie z. B. der Computerlinguistik, der Medizinischen Informatik, der Wirtschaftsinformatik oder der Bioinformatik, ergibt. Dieses fakultätsübergreifende Konzept einer anwendungsorientierten Informatik kristallisiert sich besonders am Interdisziplinären Zentrum für Wissenschaftliches Rechnen (IWR), an dem Forscher aus verschiedenen Disziplinen zusammenarbeiten. Das Zentrum verfügt über modernste Rechner, wobei die Parallelverarbeitung im Mittelpunkt steht, und bietet ein breites Lehrangebot für Studierende aller Fächer. Enge Kooperation besteht weiterhin mit dem außeruniversitären Forschungsinstitut für Informationstechnik (EML Research GmbH) der Klaus Tschira Stiftung, mit Forschungsabteilungen zu den Bereichen Computerlinguistik, Bioinformatik, u. a.

Berufsperspektiven

Absolventen der Computerlinguistik befinden sich zur Zeit in einer relativ günstigen Arbeitssituation: neben Berufsfeldern in der Industrie arbeiten Computerlinguisten an Universitäten in der ganzen Welt.

 

Formalia

Zulassung
Bachelor: Es besteht keine Zulassungsbeschränkung; eine Immatrikulation ist ohne vorherige Bewerbung möglich. Die Bewerbung bzw. Immatrikulation erfolgt online (siehe Studienportalseiten der Zentralen Universitätsverwaltung).
Für ausländische Studienbewerber gelten besondere Regelungen. Informationen erhalten Sie beim Akademischen Auslandsamt der Universität Heidelberg (Seminarstraße 2).

Fächerkombinationen

Studien- und Prüfungsordnungen

Bachelor (nach alter Prüfungsordnung)
Orientierungsprüfung
Studien- und Prüfungsordnung

Bachelor (nach neuer Prüfungsordnung) (ab WS 07/08)
Orientierungsprüfung: Bachelor (LINK wird nachgereicht)
Prüfungsordnung mit Modulübersicht und Modulhandbuch (LINK wird nachgereicht)

Master (ab WS 07/08)
Prüfungsordnung mit Modulübersicht und Modulhandbuch (LINK wird nachgereicht)
Zulassungsordnung (LINK wird nachgereicht)

Prüfungsausschuss
Zuständig für Anrechnungs-, Anerkennungs- und Prüfungsfragen ist der jeweilige Prüfungsausschuss, bzw. das Prüfungsamt. Nähere Informationen erhalten Sie bei der betreffenden Fachstudienberatung.

Fachstudienberatung
N.N.

Seminar für Computerlinguistik
Im Neuenheimer Feld 325
69120 Heidelberg
E-Mail: studienberatung@cl.uni-heidelberg.de

Studiengebühren
Die allgemeinen Studiengebühren an den Hochschulen des Landes Baden-Württemberg betragen 500,00 € pro Semester. Zusätzlich ist ein Beitrag für das Studentenwerk in Höhe von 53,60 € und ein Verwaltungskostenbeitrag in Höhe von 40,00 € zu bezahlen. Der Gesamtbetrag pro Semester beträgt somit 593,60 €.

Kontakt

Seminar für Computerlinguistik
Im Neuenheimer Feld 325
69120 Heidelberg

Sekretariat: Zi. 121
Tel.: +49 6221 54-3245
Fax: +49 6221 54-3242
E-Mail: icl@cl.uni-heidelberg.de
Internet: www.cl.uni-heidelberg.de
Lageplan

Fachschaft:
Fachschaft Computerlinguistik
Seminar für Computerlingusistik
Im Neuenheimer Feld 325
69120 Heidelberg
E-Mail: fs-coli@cl.uni-heidelberg.de
Internet: www.cl.uni-heidelberg.de/fachschaft/

zum Seitenanfang