Als «nltk» getaggte Fragen

Das Natural Language Toolkit ist eine Python-Bibliothek für Computerlinguistik.

136
n-Gramm in Python, vier, fünf, sechs Gramm?

Ich suche nach einer Möglichkeit, einen Text in n-Gramm aufzuteilen. Normalerweise würde ich so etwas machen wie: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Mir ist bewusst, dass nltk nur Bigramme...

109
So entfernen Sie Stoppwörter mit nltk oder Python

Ich habe also einen Datensatz, dessen Verwendung ich Stoppwörter entfernen möchte stopwords.words('english') Ich habe Probleme damit, dies in meinem Code zu verwenden, um diese Wörter einfach herauszunehmen. Ich habe bereits eine Liste der Wörter aus diesem Datensatz. Der Teil, mit dem ich zu...

100
Pip Problem Installation fast jeder Bibliothek

Es fällt mir schwer, mit pip fast alles zu installieren. Ich bin neu in der Codierung, daher dachte ich, dass dies möglicherweise etwas ist, was ich falsch gemacht habe, und habe mich für easy_install entschieden, um das meiste, was ich tun musste, zu erledigen, was im Allgemeinen funktioniert hat....

83
Erstellen eines neuen Korpus mit NLTK

Ich rechnete damit, dass die Antwort auf meinen Titel oft darin besteht, die Dokumentationen zu lesen, aber ich habe das NLTK-Buch durchgesehen aber es gibt keine Antwort. Ich bin ein bisschen neu in Python. Ich habe eine Reihe von .txtDateien und möchte die Korpusfunktionen verwenden können,...

76
Stoppwortentfernung mit NLTK

Ich versuche, einen vom Benutzer eingegebenen Text durch Entfernen von Stoppwörtern mit dem nltk-Toolkit zu verarbeiten, aber beim Entfernen von Stoppwörtern werden die Wörter "und", "oder", "nicht" entfernt. Ich möchte, dass diese Wörter nach dem Entfernen des Stoppworts vorhanden sind, da es...