
Einführung in die Nutzung computerlinguistischer Ressourcen
Kursbeschreibung
Dozenten/-innen | Sariya Karimova |
Veranstaltungsart | Übung |
Erster Termin | 16.04.2018 |
Zeit und Ort | 16.04.–20.04.2018, 10:00–18:00, INF 325 / PCPool (SR) |
Commitment-Frist | tbd. |
Teilnahmevoraussetzungen
Programmieren 1 (P I), Grundlagen der Linux/Unix-Bedienung.
Bitte melden Sie sich per Email beim Dozenten an mit dem Betreff [Ressourcenvorkurs].
Leistungsnachweis
Regelmäßige Teilnahme und Bearbeitung von Übungsaufgaben.
Die erfolgreiche Teilnahme am Blockkurs ist Voraussetzung für die Teilnahme am Softwareprojekt.
Inhalt
Der Vorkurs gibt Grundlagen in der Nutzung von relevanten Werkzeugen und Ressourcen für computerlinguistische Projekte. Dabei geht es sowohl um allgemeine Grundlagen der Shell (wie z.B. Ein-/Ausgabeumleitung) als auch um spezielle Toolkits (z.B. Parser, Tagger, Machine Learning Kits) und um verschiedene Korpora, die am Institut vorhanden sind. Ziel der Veranstaltung ist es, dass die Teilnehmer in der Lage sind, Tools und Daten für (Software-)Projekte zu finden und sich bei Schwierigkeiten mit ihrer Benutzung selbst zu weiter zu helfen. Die Verwendung der vorgestellten Tools und Ressourcen wird erklärt und in praktischen Übungen vertieft.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
16.04.2018 | Linux Grundlagen | Linux I Übung 1 Linux II Übung 2 |
17.04.2018 | Ressourcen, Formate, VCS, Building | Linux III Übung 3 Ressourcen Übung 4 Markup/Datenformate Übung 5 Version Control Systems Übung 6 Building Übung 7 |
18.04.2018 | Tagger, Parser, Python für NLP | Tree Tagger Übung 8 Malt Parser Übung 9 Stanford Parser Übung 10 NLTK Übung 11 Spacy Übung 12 |
19.04.2018 | Python für ML, Weka | Profiling Übung 13 NumPy & SciPy Übung 14 scikit-learn Übung 15 Weka Übung 16 |
20.04.2018 | CQP, große Datenmengen | CQP Übung 17 Big data |