Als «nlp» getaggte Fragen

Die Verarbeitung natürlicher Sprache (NLP) ist ein Teilbereich der künstlichen Intelligenz, in dem nützliche Informationen aus Daten natürlicher Sprache transformiert oder extrahiert werden. Zu den Methoden gehören maschinelles Lernen und regelbasierte Ansätze.

137
Silben in einem Wort erkennen

Ich muss einen ziemlich effizienten Weg finden, um Silben in einem Wort zu erkennen. Z.B, Unsichtbar -> in-vi-sib-le Es gibt einige Silbenregeln, die verwendet werden könnten: V CV VC CVC CCV CCCV CVCC * wobei V ein Vokal und C ein Konsonant ist. Z.B, Aussprache (5 Pro-nun-ci-a-tion;...

111
Wie mache ich Wortstemming oder Lemmatisierung?

Ich habe PorterStemmer und Snowball ausprobiert, aber beide funktionieren nicht bei allen Wörtern, da einige sehr häufig fehlen. Meine Testwörter sind: " Katzen, die Kakteen-Kakteen-Kakteen-Communitys laufen lassen ", und beide bekommen weniger als die Hälfte richtig. Siehe...

93
Wie trainiere ich den Stanford Parser mit Genia Corpus?

Ich habe einige Probleme, ein neues Modell für Stanford Parser zu erstellen. Ich habe auch die letzte Version von Stanford heruntergeladen: http://nlp.stanford.edu/software/lex-parser.shtml Und hier Genia Corpus in 2 Formaten, xml und ptb (Penn Treebank). Standford Parser kann mit ptd-Dateien...

83
Erstellen eines neuen Korpus mit NLTK

Ich rechnete damit, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgesehen aber es gibt keine Antwort. Ich bin ein bisschen neu in Python. Ich habe eine Reihe von .txtDateien und möchte die Korpusfunktionen verwenden können,...