Data Mining-Papiere / Beispiele

8

Ich suche nach mittelgroßen bis langen Artikeln / Websites / usw. zum Thema Data Mining, insbesondere dort, wo ein Datensatz von der Datenaufbereitung bis zum endgültigen Modell eingehend untersucht wird. Ich interessiere mich besonders für Diskussionen über die Anwendung von Algen des maschinellen Lernens und auch über die grundlegende Datenmodellierung. Ein Beispiel wäre Luis Torgos Buch 'Data Mining with R'. Anregungen wäre dankbar.

screechOwl
quelle
1
Interessieren Sie sich für alle Methoden des Data Mining oder nur für eine bestimmte Methode?
Michelle
Ich werde nehmen, was ich bekommen kann.
ScreechOwl
Ich bin auf der Suche nach spezifischeren Informationen darüber, wie man durch einen bestimmten Datensatz geht. Einige der KDD Cup-Zuschreibungen von Gewinnerteams entsprechen dem, wonach ich suche. Grundsätzlich Narrative zum Umgang mit Problemen, die für einen bestimmten Datensatz spezifisch sind. Die Analogie wäre eine Fallstudie an einer Business School, in der eine Situation in einem Unternehmen ausführlich besprochen wird.
ScreechOwl

Antworten:

4

Besuchen Sie den Kaggle.com-Blog , in dem die Gewinner ihre Ansätze zur Lösung eines Data Mining-Wettbewerbs diskutieren. Sie können dann zur Website kaggle.com zurückkehren, um die Beschreibung und die Daten abzurufen und selbst auszuprobieren.

Galit Shmueli
quelle
4

Hier ist ein guter Anfang:

Top 10 Algorithmen im Data Mining

Nicht viel in Bezug auf die Datenaufbereitung, aber viel in Bezug auf Anwendungen. Und viele gute Links zu relevanten Artikeln zum Lesen.

Igor
quelle
2

Ich empfehle Ihnen Artikel aus dem kostenlosen Journal of Statistical Software.

Dort finden Sie verschiedene Anwendungen des Data Mining / Maschinellen Lernens zusammen mit der Analyse realer Datenbeispiele. Die meisten Artikel befassen sich mit R-Paketen, sodass Sie ihre Analysen auch gleichzeitig in R durchführen können. Artikel im Journal enthalten auch R-Code und Pakete in R enthalten Daten.

Alle Daten werden dort eingehend analysiert, so dass es für mich eine sehr wertvolle Quelle ist.

Miroslav Sabo
quelle
1

Das Caret R-Paket enthält einen Satz von vier Vignetten, die verschiedene Datenaufbereitungsaufgaben, überwachte Lernalgorithmen, Funktionsauswahl und Datenvisualisierungen ausgehend von einigen Beispieldatensätzen ausführen.

Obwohl der Schwerpunkt darauf liegt, wie diese Dinge mit den von Caret selbst bereitgestellten Funktionen ausgeführt werden können, ist sie dennoch allgemein anwendbar und für reale Projekte ziemlich gut lesbar.

Hier sind direkte Links zu den vier PDF-Vignetten:

scttl
quelle