Hallo, ich wollte wissen, ob es einige gute Bücher zum Thema Text Mining und Klassifizierung mit einigen Fallstudien gibt. Wenn nicht, würden einige öffentlich zugängliche Papiere / Zeitschriften ausreichen. Wenn sie ihre Beispiele mit R noch besser veranschaulichen. Ich suche kein schrittweises Handbuch, sondern etwas, das die Vor- und Nachteile verschiedener Text-Mining-Ansätze für verschiedene Problemklassen veranschaulicht.
quelle
Ich habe kürzlich vier Bücher in diesem Bereich gelesen:
Dieser konzentriert sich auf praktische Beispiele, Software und angewandtes Text Mining. Es enthält mehrere Beispiele für die praktische Verwendung von Text-Mining. Es könnte von Interesse sein, wenn Sie mehr über kommerzielle Anwendungen von Text-Mining-Tools erfahren möchten.
Es handelt sich um eine Reihe von Forschungsarbeiten, die als Beispiele für die Verwendung verschiedener Text-Mining-Tools verwendet werden. Es ist eher zu fokussiert als für den Einführungstest.
Sehr einführender Text, der einige allgemeine Probleme beschreibt.
Dies ist das beste Buch, das ich bereits zu diesem Thema gelesen habe. Es ist gut geschrieben, klar, geht tiefer in die Theorie ein, aber auf praxisfreundliche Weise. Beginnt mit einer allgemeinen Einführung, geht dann aber auf einige der am häufigsten verwendeten Methoden und Algorithmen ein. Wenn Sie nur ein einziges Buch auswählen müssten, würde ich dieses empfehlen.
Sie können auch leicht mehrere Bücher über die Verarbeitung natürlicher Sprache und Text Mining finden, die sich auf die Verwendung von R ( tm library) oder Python ( nltk library) konzentrieren.
quelle
Dies ist möglicherweise nicht genau das Richtige für das, wonach Sie suchen, aber das Beherrschen regulärer Ausdrücke von Jeffrey Friedl ist eine großartige Quelle, um zu lernen, wie man reguläre Ausdrücke zum Parsen von Text verwendet. Er geht nicht auf Modellierungstechniken ein, aber angesichts der Anzahl der regulären Ausdrücke können Sie eine Vielzahl von Standardmodellierungsansätzen anwenden.
quelle
Ein Buch, auf das ich immer wieder zurückgreife, ist Text Mining: Predictive Methods ... von Sholom Weiss. Es gibt viele Ideen für die Lösung von Problemen, die ich nützlich finde, da es beim Text Mining manchmal darum geht, verschiedene Dinge auszuprobieren - globales oder lokales Wörterbuch, Anzahl der zu behaltenden Funktionen usw. Ich finde, dass dieses Buch ein guter Ideengeber ist. Es hat auch Fallstudien.
quelle
Ich schlage vor, NLP unter http://www.nltk.org/ ist kostenlos und koppelt mit NLTK in Python. Alles Gute
quelle