Hein,
Es gibt viele Tools und Bibliotheken mit der verfügbaren Funktionalität.
Welche Sie wählen müssen, hängt davon ab, ob Sie eine GUI für Ihre Arbeit verwenden möchten oder ob Sie sie in ein anderes Programm einbetten möchten.
Standalone-Data-Mining-Tools (es gibt andere wie WEKA mit Java-Schnittstelle):
- Rapid Miner
- Orange
- Rassel Gui für R.
- KNIME
Textbasiert:
Bibliotheken:
- Scikit für Python
- Mahout auf Hadoop
Wenn Sie eine Programmiersprache gut genug kennen, würde ich eine Bibliothek für diese Sprache verwenden oder R ausprobieren. Wenn nicht, können Sie eines der Tools mit GUI ausprobieren.
Ein Baumbeispiel in R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Wie vorgeschlagen, müssen Sie sich bei der Analyse mit R selbst codieren. Für die meisten Klassifizierungsaufgaben finden Sie jedoch ein Paket, das sofort funktioniert. Eine Übersicht finden Sie hier Machine Learning Task View
Um mit RapidMinder zu beginnen, sollten Sie sich Youtube ansehen. Es gibt einige Screencasts, auch für Entscheidungsbäume.
Weka ist eine kostenlose Open-Source-Suite für maschinelles Lernen. Sie haben eine GUI sowie eine API, die Sie von Ihrem Java-Code aus aufrufen können, wenn Sie möchten.
Sie haben viele Klassifizierungsalgorithmen, einschließlich mehrerer Entscheidungsbaumalgorithmen. Diese sind in der Benutzeroberfläche verfügbar. Die nächsten Nachbarn sind etwas kniffliger und es scheint, dass Sie die API direkt verwenden müssen .
Ich denke, Rapid Miner unterstützt diese Art von Dingen wahrscheinlich, aber ich habe sie noch nie für solche Zwecke verwendet.
Sie könnten auch R in Betracht ziehen , aber das könnte erfordern, dass Ihre Hände etwas schmutziger werden.
Beachten Sie, dass Netflix eine Menge Arbeit bei der Klassifizierung von Filmbewertungen geleistet hat. Vor einigen Jahren haben sie der Gruppe einen Preis in Höhe von 1 Million US-Dollar angeboten , der ihre Klassifizierung am meisten verbessern könnte. Vielleicht möchten Sie lesen, wie verschiedene Teams dieses Problem angegangen sind.
quelle
Kann sein ... WEKA? http://www.cs.waikato.ac.nz/ml/weka/
quelle