Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Einführung in die Nutzung computerlinguistischer Ressourcen

Kursbeschreibung

Dozenten/-innen Sariya Karimova
Veranstaltungsart Übung
Erster Termin 16.04.2018
Zeit und Ort 16.04.20.04.2018, 10:0018:00, INF 325 / PCPool (SR)
Commitment-Frist tbd.

Teilnahmevoraussetzungen

Programmieren 1 (P I), Grundlagen der Linux/Unix-Bedienung.

Bitte melden Sie sich per Email beim Dozenten an mit dem Betreff [Ressourcenvorkurs].

Leistungsnachweis

Regelmäßige Teilnahme und Bearbeitung von Übungsaufgaben.

Die erfolgreiche Teilnahme am Blockkurs ist Voraussetzung für die Teilnahme am Softwareprojekt.

Inhalt

Der Vorkurs gibt Grundlagen in der Nutzung von relevanten Werkzeugen und Ressourcen für computerlinguistische Projekte. Dabei geht es sowohl um allgemeine Grundlagen der Shell (wie z.B. Ein-/Ausgabeumleitung) als auch um spezielle Toolkits (z.B. Parser, Tagger, Machine Learning Kits) und um verschiedene Korpora, die am Institut vorhanden sind. Ziel der Veranstaltung ist es, dass die Teilnehmer in der Lage sind, Tools und Daten für (Software-)Projekte zu finden und sich bei Schwierigkeiten mit ihrer Benutzung selbst zu weiter zu helfen. Die Verwendung der vorgestellten Tools und Ressourcen wird erklärt und in praktischen Übungen vertieft.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
16.04.2018 Linux Grundlagen Linux I
Übung 1

Linux II
Übung 2
17.04.2018 Ressourcen, Formate, VCS, Building Linux III
Übung 3

Ressourcen
Übung 4

Markup/Datenformate
Übung 5

Version Control Systems
Übung 6

Building
Übung 7
18.04.2018 Tagger, Parser, Python für NLP Tree Tagger
Übung 8

Malt Parser
Übung 9

Stanford Parser
Übung 10

NLTK
Übung 11

Spacy
Übung 12
19.04.2018 Python für ML, Weka Profiling
Übung 13

NumPy & SciPy
Übung 14

scikit-learn
Übung 15

Weka
Übung 16
20.04.2018 CQP, große Datenmengen CQP
Übung 17

Big data

zum Seitenanfang