Was sind die Text-Mining-Pakete für R und gibt es andere Open-Source-Text-Mining-Programme?

12

Können Sie ein Text-Mining-Paket in R empfehlen, das für große Datenmengen verwendet werden kann?
Zweitens gibt es eine GUI für eines der Text Mining-Pakete in R?
Drittens, gibt es ein weiteres Open-Source-Text-Mining-Programm, das einfach und intuitiv zu bedienen ist?


quelle
@mbq: Nun, gibt es ein Open-Source-Text-Mining-Paket mit einer GUI? würde wahrscheinlich alle drei Fragen ziemlich gut abdecken, es ist irgendwie schon eine Frage ...
naught101

Antworten:

4

Hier sind zwei weitere integrierte Projekte:

  • Python Natural Language Toolkit (einfache Installation, gute Dokumentation)
  • Java MALLET (keine Erfahrung damit, sieht aber vielversprechend aus; im Link von @Nick enthalten)

Beide sind Open-Source-Software.

chl
quelle
3

Klar, RapidMiner mit der Text-Mining-Erweiterung.

Es gibt viele Videos, die zeigen, wie es gemacht wird.


quelle
2
Hier ist eine 5-teilige Videoserie: vancouverdata.blogspot.com/2010/11/…
Neil McGuigan
1

GATE ist sehr umfangreich. Sie können auch mit verschiedenen Sprachen arbeiten und verfügen über einen Ontologie-Editor.

Ralph Winters
quelle
0

Andrew McCallum (UMass) stellt auf seiner Webseite einige NLP-bezogene Softwareprojekte zur Verfügung . Diese sind alle in Java (glaube ich) mit Quellcode verfügbar.

Nick
quelle