1. Analysieren Sie die Mikrostruktur der Einträge so genau wie möglich. Unterscheiden Sie dabei zwischen form- und inhaltsbasierten Elementen! 2. Kodieren Sie einen dieser Wörterbuchartikel in XML, indem Sie die fol- gende DTD verwenden: Hinweise zur Arbeit (die vollständige und dokumentierte DTD finden Sie unten): • Segmentieren und analysieren Sie den Artikel. • Übernehmen Sie die Artikelteile, die sich mit der vorhandenen DTD annotieren lassen. • Wenn ein Artikelteil nicht in die vorhandene DTD passt, dann vermer- ken Sie dies bitte. 3. Bei der Analyse von Wörterbuchdefinitionen sind Bedeutungsbeschrei- bungen für Nomen oft schwierig zu parsen. Vossen et al. (1989) haben das sog. Kontrollvokabular des LDOCE, das ca. 2 000 Wörter umfasst, die in den Definitionen zur Bedeutungsexplikation verwendet werden, unter- sucht und aufbereitet. Die sog. Kernels (Headwords) in den Definitionen werden unterschiedlich, je nach ihrem semantischen Gehalt, klassifiziert. Mitunter gibt es Ambiguitäten (vgl. die of-Phrasen-Modifikation inner- halb der Definitionen). Anhand der folgenden Beispiele sollen Gruppen analog typischer Struk- turen gebildet und informell erklärt werden: • cocktail: „a mixed alcoholic drink“ • bourgeois: „a member of the middle class“ • air mattress: „airbed“ • author: „the writer of a book, newspaper article, play, poem, etc.“ • ambiguity: „the condition of being ambiguous“ • destroyer: „a person who destroys“ • abbey: „the group of people living in such a building“ • detonation: „the noise of an explosion“ • discouragement: „something that discourages“ • car: „automobile