############### Abverz_doku.txt ############################ # # # Project Acronym: PaGAL # # Document ID: # # Date: 01/10/01 # # Author: Meike Griese # # WP/Task T . # # Abstract: The rules found about the abbreviation # # -register are documented # # Distribution: public # ################################################################### # Version Date Author Notes # # 01 30/10/01 G # # # # # # # # # ################################################################### Mit dem erweiterten Abkuerzungsverzeichnis des PT1.6 werden folgende Formen erkannt: Substantive im Nominativ Singular Adjektive in der unflektierten Form Damit werden aus der gesamten Textsubstanz 88079 Formen als im Verzeichnis gelistet erkannt. Davon werden 4836 falsch abgekuerzt, das sind 5.49 % aller vom PT1.6 gemachten Fehler. Die Untersuchung der Fehler, die in der Statistik verzeichnet sind ergab folgende Ursachen: Teilweise wurde die Abkuerzung richtig generiert, aber bei dem Vergleich mit der Abkuerzung im Text stimmte sie aus folgenden Gruenden nicht ueberein: - Sonderzeichen, die nicht zu der Abkuerzung gehoeren (z.B. die Curser-Position) Dezember Dez. - Inkosistente Verwendung z.B. der geschuetzten Leerzeichen Vorkommen im Text: New York N.&spfest;Y. Vorkommen im Verzeichnis: New York N.&spvgev;Y. Vorkommen im Text: im engeren Sinn i.&spvgev;e. S. Vorkommen im Verzeichnis: im engeren Sinn i.&spvgev;e.&spvgev;S. - sonstige Fehler der Abkuerzung im Text; z.B. Einwohner Ew griechisch griech. Jedoch werden flektierte Formen der im Verzeichnis gelisteten Woerter nicht erkannt und erscheinen in der Statistik als Fehler bei notpossible. So muss in einem naechsten Schritt moeglich gemacht werden, auch flektierte Formen zu erkennen und die richtige Abkuerzung zu generieren. Dabei handelt es sich z.B. bei den Endungen -s, -e, -en, -n, -ern um moegliche Deklinationsendungen. Eine weitere Erweiterung des Abkuerzungsverzeichnisses ist sinnvoll.