Was ist der Unterschied zwischen einem Wahlkreis-Parser und einem Abhängigkeitsparser ? Was sind die unterschiedlichen Verwendungen der beiden?
Ein Wahlkreis-Analysebaum unterteilt einen Text in Unterphrasen. Nicht-Terminals im Baum sind Arten von Phrasen, die Terminals sind die Wörter im Satz und die Kanten sind unbeschriftet. Für einen einfachen Satz "John sieht Bill" wäre eine Wahlkreisanalyse:
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
Eine Abhängigkeitsanalyse verbindet Wörter entsprechend ihrer Beziehungen. Jeder Scheitelpunkt im Baum stellt ein Wort dar, untergeordnete Knoten sind Wörter, die vom übergeordneten Knoten abhängig sind, und Kanten werden durch die Beziehung gekennzeichnet. Eine Abhängigkeitsanalyse von "John sieht Bill" wäre:
sees
|
+--------------+
subject | | object
| |
John Bill
Sie sollten den Parsertyp verwenden, mit dem Sie Ihrem Ziel am nächsten kommen. Wenn Sie an Unterphrasen innerhalb des Satzes interessiert sind, möchten Sie wahrscheinlich die Wahlkreisanalyse. Wenn Sie an den Abhängigkeitsbeziehungen zwischen Wörtern interessiert sind, möchten Sie wahrscheinlich die Abhängigkeitsanalyse.
Der Stanford-Parser kann Ihnen beides geben ( Online-Demo ). Tatsächlich funktioniert es, den Satz immer mit dem Wahlkreis-Parser zu analysieren und dann bei Bedarf eine deterministische (regelbasierte) Transformation des Wahlkreis-Analysebaums durchzuführen, um ihn in einen Abhängigkeitsbaum umzuwandeln.
Mehr finden Sie hier: