NPGrammar

Ein Partieller Parser zur Extraktion von Nominalphrasen

Die folgende Tabelle liefert einen Überblick über die im Parcel NPGrammar enthaltenen Klassen. NPGrammar ist eine Unterklasse vom Parsingtool XGrammar, das am Fraunhofer Institut entwickelt wurde. Über XGrammar können auf dieser Seite keine Angaben gemacht werden.

Klasse kurze Zusammenfassung

NPGrammar NPGrammar ist eine Unterklasse des Parsingtools XGrammar, das am Fraunhofer Institut entwickelt wurde. Mit NPGrammar werden Nominalphrasen größtmöglicher Menge aus Texten extrahiert und syntaktisch hierarchisiert. Gestartet wird der Parsevorgang in NPGrammarXtract, eine Unterklasse von NPGrammar.

NPGrammarArrays In NPGrammarArrays werden Arrays mit bestimmten Wortarten oder für entsprechende Abfragen terminaler Testmethoden gespeichert.. Unter der Kategorie preposition befinden sich Arrays zu den deutschen Präpositionen; mittels derer entschieden wird, ob eine Präpositionalphrasenanbindung vorliegt oder nicht. Eine PP-Anbindung liegt vor, wenn entweder das letzte Nomen oder das Head-Nomen der Gesamtphrase in dem präpositionsspezifischen Array enthalten ist.

NPGrammarGUI NPGrammarGUI liefert die graphische Benutzeroberfläche und ruft die Startmethode der Klasse NPGrammarXtract auf.

NPGrammarLemmatize NPGrammarLemmatize dient zur Lemmatisierung von Substantiven, Adjektiven und Determinationen. Eine Lemmatisierung von Substantiven ist dann erforderlich, wenn eine Abfrage auf Enthaltensein in den Präpositionsarrays durchgeführt wird. Lemmatisierung von Adjektiven und Determinationen müssen immer durchgeführt werden. Ausnahme: Abfrage von Adjektiven in Funktion eines Partikels.

NPGrammarSentenceSplitter NPGrammarSentenceSplitter dient zur Vorbereitung des Textes für die eigentliche Analyse. Es müssen im Text die entsprechenden Tags gesetzt werden. Startmethode: setMarker: aString

NPGrammarXtract NPGrammarXtract ist das "Herzstück" des Analyseprogramm. In dieser Klasse wird der Parsevorgang gestartet, alle entsprechenden terminalen und nichtterminalen Methoden durchlaufen und das Ergebnis in die entsprechende Datei ausgegeben. Startmethode: parseFromFile: aString startSymbol: aSymbol dir: aDirectory

NPTree In NPTree werden die gesamten Baumstrukturen einer Teilphrase erzeugt.

Klasse	kurze Zusammenfassung
NPGrammar	NPGrammar ist eine Unterklasse des Parsingtools XGrammar, das am Fraunhofer Institut entwickelt wurde. Mit NPGrammar werden Nominalphrasen größtmöglicher Menge aus Texten extrahiert und syntaktisch hierarchisiert. Gestartet wird der Parsevorgang in NPGrammarXtract, eine Unterklasse von NPGrammar.
NPGrammarArrays	In NPGrammarArrays werden Arrays mit bestimmten Wortarten oder für entsprechende Abfragen terminaler Testmethoden gespeichert.. Unter der Kategorie preposition befinden sich Arrays zu den deutschen Präpositionen; mittels derer entschieden wird, ob eine Präpositionalphrasenanbindung vorliegt oder nicht. Eine PP-Anbindung liegt vor, wenn entweder das letzte Nomen oder das Head-Nomen der Gesamtphrase in dem präpositionsspezifischen Array enthalten ist.
NPGrammarGUI	NPGrammarGUI liefert die graphische Benutzeroberfläche und ruft die Startmethode der Klasse NPGrammarXtract auf.
NPGrammarLemmatize	NPGrammarLemmatize dient zur Lemmatisierung von Substantiven, Adjektiven und Determinationen. Eine Lemmatisierung von Substantiven ist dann erforderlich, wenn eine Abfrage auf Enthaltensein in den Präpositionsarrays durchgeführt wird. Lemmatisierung von Adjektiven und Determinationen müssen immer durchgeführt werden. Ausnahme: Abfrage von Adjektiven in Funktion eines Partikels.
NPGrammarSentenceSplitter	NPGrammarSentenceSplitter dient zur Vorbereitung des Textes für die eigentliche Analyse. Es müssen im Text die entsprechenden Tags gesetzt werden. Startmethode: setMarker: aString
NPGrammarXtract	NPGrammarXtract ist das "Herzstück" des Analyseprogramm. In dieser Klasse wird der Parsevorgang gestartet, alle entsprechenden terminalen und nichtterminalen Methoden durchlaufen und das Ergebnis in die entsprechende Datei ausgegeben. Startmethode: parseFromFile: aString startSymbol: aSymbol dir: aDirectory
NPTree	In NPTree werden die gesamten Baumstrukturen einer Teilphrase erzeugt.

NPGrammar

Instance Variables:
adjektivList

Klassenmethoden
signs Liste von Zeichen, die im Text als Token erkannt werden sollen
tags Liste von tags, die im Text als token erkannt werden sollen
AdjektivSet Set deutscher Adjektive zum Ablgeichen beim Parsen

Instanzmethoden
setNPComplex Datei für die komplexen Phrasen wird angelegt
setNPStrings Anlegen der Datei für die als String ausgegebenen extrahierten Nominalphrasen
setSimpleNP Anlegen der Datei für die einfach strukturierten Phrasen
setXMLFile Anlegen der Datei für die Links

Klassenmethoden
lemmatizeAdjOrDet: aToken einfache Lemmatisierung von Adjektiven
lemmatizeNomen: aToken Lemmatisierung von Nomen und Abgleich mit der Substantivliste. Falls nichts passt, wird ein leerer String zurückgeben

Instanzmethoden
lemNomEnding_E: aToken
lemNomEnding_E: aToken1 And: aToken2 UmlautTest ohne Endungstilgung, also auf e
lemNomEnding_N: aToken Token ohne Umlaut ausgeben
lemNomEnding_N: aToken1 And: aToken2
lemNomEnding_R: aToken
lemNomEnding_R: aToken1 And: aToken2
lemNomEnding_S: aToken1