Ich arbeite an einem kleinen Textkorpus (200 Millionen), den ich mit einer Clusteranalyse untersuchen möchte. Welche Bücher oder Artikel zu diesem Thema würden Sie empfehlen?
Ich arbeite an einem kleinen Textkorpus (200 Millionen), den ich mit einer Clusteranalyse untersuchen möchte. Welche Bücher oder Artikel zu diesem Thema würden Sie empfehlen?
Es kann sich lohnen, MW Berrys Bücher zu lesen:
Sie bestehen aus einer Reihe von Arbeitspapieren und Übersichtsarbeiten. Die neueste scheint als PDF unter folgender Adresse verfügbar zu sein: http://bit.ly/deNeiy .
Hier sind einige Links zu CA im Zusammenhang mit Text Mining:
Sie können sich auch die latente semantische Analyse ansehen , sehen dort aber meine Antwort: Ein Clustering-Problem durcharbeiten .
Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse von den Professoren Leonard Kaufman und Peter J. Rousseeuw.
Ich lese das Buch und finde es sehr nützlich, weil:
Unser Ziel war es, ein anwendbares Buch für den allgemeinen Benutzer zu schreiben. Wir wollten die Clusteranalyse für Personen verfügbar machen, die nicht unbedingt einen starken mathematischen oder statistischen Hintergrund haben.
Es enthält theoretische Inhalte zum Verständnis der im R
Paket Cluster verfügbaren Funktionen .
Die Kapitel können nach der gewünschten Cluster-Methode einzeln gelesen werden.
Ausnahme ist Kapitel 3, das auf Kapitel 2 aufbaut
Die Kapitel des Buches sind:
Verweise:
Kaufman, L. & Rousseeuw, PJ (2005). Suchen von Gruppen in Daten. Eine Einführung in die Clusteranalyse (S. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Clusteranalyse Erweitert Rousseeuw et al. CRAN.
Dieses Kapitel der Einführung in Data Mining ist online verfügbar und bietet einen schönen Überblick.
quelle
Die Clusteranalyse von Brian S. Everitt ist eine schöne, buchlange angewandte Behandlung der Clusteranalyse.
quelle
Nicht speziell über Text-Mining, aber ich mochte "Exploratory Data Analysis with MATLAB" von Martinez und Martinez.
quelle
Ein weiteres ausführliches Buch, das einen Blick wert ist: das Handbuch zur Clusteranalyse von Hennig et al. (2015)
quelle