Vorkurs/SoSe 2012

Ressourcen-Vorkurs

Dozent Schigehiko Schamoni, Felix Hieber, Katharina Wäschle, Patrick Simianer
Veranstaltungsart Blockveranstaltung/Übung
Zeit 10.-13.04.2012, jeweils 10-13 und 14-17 Uhr
Ort Im Neuenheimer Feld 325, PC-Pool
Studiengang ABA, NBA, Magister
Anmeldung Bitte per E-Mail an den Dozenten

Leistungsnachweis

Anwesenheit, Teilnahme an den Übungen, Mitarbeit.

Die Teilnahme am Blockkurs ist Voraussetzung für die Teilnahme am Softwareprojekt.

Inhalt

Der Vorkurs gibt Grundlagen in der Nutzung von Linux-basierten computerlinguistischen Tools und Korpora. Dabei geht es sowohl um allgemeine Linux-Grundlagen (wie z.B. Ein-/Ausgabeumleitung oder nützliche Tools der Linux-Kommandozeile) als auch um einzelne Parser, Tagger, Chunker und andere Hilfstools der Computerlinguistik. Wir werden uns anschauen, wie bestimmte Tools zu benutzen sind, was man aus ihnen herausbekommt (und was nicht) und wie man solche Ausgaben automatisch weiterverarbeiten kann (und zum Beispiel an das nächste Tool weiterverfüttert).

Grundlagen der Linux/Unix-Bedienung werden vorausgesetzt und müssen gegebenfalls im Selbststudium erlernt (und geübt) werden! Dies sollte vor dem Kurs stattfinden, einen umfassenden Überblick gibt z.B. der  Advanced Bash-Scripting Guide oder Folien und Übungen vom letzten Kurs.

Plan

Block Themen Slides, Übungen
Dienstag, 10-13 Uhr Intro I: Pipes, Shell-scripting Folien Übung Folien Übung
Dienstag, 14-17 Uhr Intro II: Encoding; Ressourcen und Korpora am ICL Folien Folien Übung
Mittwoch, 10-13 Uhr Versionskontrolle; Arbeiten mit großen Datenmengen Folien Übung Folien
Mittwoch, 14-17 Uhr C & C Folien Tutorial
Donnerstag, 10-13 Uhr NLTK Folien Übung
Donnerstag, 14-17 Uhr XML, XSLT, Utilities Folien Übung Folien Übung
Freitag, 10-13 Uhr Weka, CQP Folien Übung Folien Übung
Freitag, 14-16 Uhr cdec, anschließend Poster-Session Folien dauern noch etwas!

Achtung: Dieser Plan ist vorläufig und wird ohne besondere Ankündigung geändert.

awk one liners:

 http://www.pement.org/awk/awk1line.txt

 http://www.catonmat.net/blog/awk-one-liners-explained-part-one/

Attachments