Obwohl ich als Ingenieur ausgebildet wurde, interessiere ich mich immer mehr für Data Mining. Im Moment versuche ich, das Feld weiter zu untersuchen. Insbesondere möchte ich die verschiedenen Kategorien von Softwaretools verstehen, die existieren und welche Tools in jeder Kategorie bemerkenswert sind und warum. (Beachten Sie, dass ich nicht die "besten" Tools genannt habe, sondern nur die bemerkenswerten, damit es nicht zu einem Flammenkrieg kommt.) Beachten Sie insbesondere die Tools, die Open Source und frei verfügbar sind Ich interessiere mich nur für Open Source und Free.
data-mining
John Berryman
quelle
quelle
Antworten:
Dies ist wahrscheinlich die umfassendste Liste, die Sie finden werden: mloss.org
quelle
Schau es dir an
und das UCI Machine Learning Repository für Datensätze.
quelle
Rattle ist eine Data Mining-GUI, die ein Front-End für eine Vielzahl von R-Paketen bietet.
quelle
Schauen Sie sich KNIME an .
Sehr leicht zu erlernen. Mit viel Spielraum für weitere Fortschritte. Passt gut zu Weka und R.
quelle
Aus der Sicht der Popularität werden in diesem Artikel (2008) die Top-10-Algorithmen im Data Mining untersucht .
quelle
RapidMiner (Java) [Open Source]
quelle
Es gibt ELKI , ein Open-Source-Universitätsprojekt, das etwas mit WEKA vergleichbar ist, aber in Bezug auf Clustering und Ausreißererkennung viel stärker ist. WEKA ist eigentlich kein eigentliches Data-Mining, sondern eine Software für maschinelles Lernen.
quelle
Es gibt diesen Red-R, der eine schöne GUI und eine visuelle Programmierschnittstelle hat. Es verwendet R, um die verschiedenen Datenanalysen durchzuführen.
quelle
Rexer Anlaytics führt jedes Jahr eine Toolkit-Umfrage durch. KDnuggets enthält Softwarebeschreibungen nach Branchen und Absichten.
quelle
SQL Server Data Mining (SSDM) wurde schon lange nicht mehr aktualisiert, ist jedoch immer noch recht wettbewerbsfähig, wenn Sie große relationale Datenbanken und Cubes abbauen. Ich arbeite mich langsam, aber systematisch durch Tests so vieler Mining-Tools wie möglich. Die Windows-Oberfläche von SQL Server ist die produktivste und stabilste, die ich bisher gefunden habe (insbesondere bei Unternehmensdatenbanken, von denen einige überraschend sind) schlampige Schnittstellen) trotz seines Alters. Ich würde eine moderne Windows Presentation Foundation (WPF) -Schnittstelle bevorzugen, aber dies ist die nächstbeste Sache.
Ich habe eine ganze Reihe detaillierter Amateur-Tutorials mit dem Titel Eine waghalsige Treppe zu SQL Server Data Mining geschrieben , als ich versuchte, einige grundlegende Mining-Kenntnisse zu erwerben. Trotz meiner Unerfahrenheit sind sie immer noch hilfreich, um einige der "Fallstricke" im Voraus zu identifizieren.
quelle