Können Sie ein Text-Mining-Paket in R empfehlen, das für große Datenmengen verwendet werden kann?
Zweitens gibt es eine GUI für eines der Text Mining-Pakete in R?
Drittens, gibt es ein weiteres Open-Source-Text-Mining-Programm, das einfach und intuitiv zu bedienen ist?
12
Antworten:
Weitere Informationen finden Sie in der CRAN-Task-Ansicht zur Verarbeitung natürlicher Sprachen , die unter anderem das von Josh bereits erwähnte TM- Paket enthält.
quelle
Siehe das tm-Paket und diese Präsentation von Stefan Theussl auf der R / Finance-Konferenz 2010 .
quelle
Hier sind zwei weitere integrierte Projekte:
Beide sind Open-Source-Software.
quelle
Klar, RapidMiner mit der Text-Mining-Erweiterung.
Es gibt viele Videos, die zeigen, wie es gemacht wird.
quelle
GATE ist sehr umfangreich. Sie können auch mit verschiedenen Sprachen arbeiten und verfügen über einen Ontologie-Editor.
quelle
Andrew McCallum (UMass) stellt auf seiner Webseite einige NLP-bezogene Softwareprojekte zur Verfügung . Diese sind alle in Java (glaube ich) mit Quellcode verfügbar.
quelle
Neben der von Dirk erwähnten CRAN-Task-Ansicht zur Verarbeitung natürlicher Sprachen gibt es ein Quanteda-Paket und ein NLP-Paket .
quelle