Ich habe python-nltk unter Ubuntu Server 12.04 mit apt-get installiert.
Wenn ich jedoch versuche, einen Korpus herunterzuladen, wird folgende Fehlermeldung angezeigt:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
Fehlt mir eine Konfiguration oder ein zusätzliches Paket?
wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install
. Aber ein Problem wurde in github.com/nltk/nltk/issues/747Antworten:
Die
DEFAULT_URL
indownloader.py
der Ubuntu-Paketversion verwendete Version verwendet weiterhin:Der aktuelle Datenserver ist jedoch:
Sie können natürlich von der Quelle installieren oder ... Ihre bereits installierte Version so ändern, dass sie auf den neuen Server verweist:
Sie können dann den "braunen" Korpus installieren:
quelle
Es ist möglich, dies zu beheben, ohne den Quellcode zu ändern. Erstellen Sie einen benutzerdefinierten Downloader in Python:
Dann öffnen Sie einen GUI-Dialog:
Überprüfen Sie, ob Sie Schreibzugriff auf das Download-Verzeichnis haben, und laden Sie herunter, was Sie benötigen.
quelle
Dieser aktualisiert das nltk und
nltk.download()
funktioniert dann wieder.quelle