Ich suche eine Website oder ein Buch, auf der Schritt für Schritt einige praktische Beispiele gegeben werden, in denen erklärt wird, wie sie die relevanten Funktionen, das Modellauswahlverfahren usw. auswählen.
Ich suche eine Website oder ein Buch, auf der Schritt für Schritt einige praktische Beispiele gegeben werden, in denen erklärt wird, wie sie die relevanten Funktionen, das Modellauswahlverfahren usw. auswählen.
Wenn Sie ein anwendungsorientiertes Buch wünschen, sollten Sie Christopher Bishops modellbasiertes maschinelles Lernen in Betracht ziehen . Er hat mehr technische Bücher, die sehr geschätzt werden.
Wenn Sie nach viel Code suchen, ist Probabilistic Programming & Bayesian Methods for Hackers eine Option.
Ein weiteres Einführungsbuch mit einem statistischen gebogen ist eine Einführung in der statistischen Lernen mit Anwendungen in R . Auch hier haben die Autoren eine angesehene technische Version des Buches.
Ich hatte vor ein paar Wochen die gleiche Frage.
Ich persönlich fand O'Reillys Python für die Datenanalyse sehr nützlich, um die Grundlagen zu erlernen. Das Buch setzt voraus, dass Sie über einige Programmiererfahrungen in Python verfügen, enthält jedoch auch einen Anhang im Hintergrund, in dem die Grundlagen erläutert werden.
Der Autor gibt Ihnen zu Beginn eine Vielzahl von Beispielen aus der realen Welt (nicht Monty Python), die Sie in den ersten Kapiteln erstellen können, und geht dann im weiteren Verlauf des Buches detailliert auf jede Sache ein und baut Ihr Wissen auf.
Ich fand die Anleitung sehr einfach und Schritt für Schritt. Mein Professor, der mich bei all dem unterstützt, war beeindruckt, wie schnell ich gelernt habe.
Ich habe auch gute Dinge über Kaggle gehört.
Data Science in der Cloud mit Microsoft Azure Machine Learning und R ist ein kostenloses Lehrbuch, das ein Beispiel ausführlich behandelt. Lassen Sie sich nicht von den verwendeten Tools abschrecken, da Sie sie nicht benötigen, um einen Nutzen aus dem Buch zu ziehen.
Eine andere, die mir gefallen hat, ist das Programmieren von Collective Intelligence, das auch eine Reihe von Projekten im Detail durchläuft, einschließlich des Web-Scraping-Teils, den die meisten Bücher beschönigen.
Ich kann diese Sammlung von Ipython-Notizbüchern empfehlen, die kommentierte Notizbücher zu Data Science, Statistik und maschinellem Lernen enthält.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
Ein Ort, an dem Sie möglicherweise interessante Schritt-für-Schritt- Erklärungen finden, ist das Kaggle-Tutorial und die Gewinnerinterviews . Oft veröffentlichen die Leute eine detaillierte Zusammenfassung ihres Ansatzes.
Eines der besten Bücher, auf das ich gestoßen bin, ist Maschinelles Lernen in Python von Sebastian Raschka. Einfache Beispiele, schrittweise Erklärungen und genau die richtige Menge an Mathematik.
Die Struktur des Buches deckt den gesamten Prozess von der Datenbereinigung bis zur Zusammenstellung und Auswertung ab.
quelle
Schauen Sie sich an:
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
In diesem Schritt-für-Schritt-Tutorial erhalten Sie einen Überblick über den gesamten Prozess der Datenexploration, Datenanalyse und Erstellung eines Vorhersagemodells.
Hier finden Sie Erläuterungen zur Datenexploration und zum Feature-Engineering (Auswahl relevanter Features):
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Sehen Sie sich hier die ersten 5 Datensätze mit Tutorials an und arbeiten Sie daran, um praktische Erfahrungen zu sammeln:
https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/
Schauen Sie sich auch an:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
Dabei verwendet er mehrere Modelle für einen einzelnen Datensatz, um Ihnen ein grundlegendes Verständnis der verschiedenen Modelle zu vermitteln.
Weitere Informationen zur Modellauswahl finden Sie hier:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
Der obige Link enthält Antworten von Personen, die vor Ort arbeiten.
Um Einblicke in verschiedene Datensätze zu erhalten, können Sie sich jederzeit bei kaggle anmelden, an Wettbewerben teilnehmen und sich die zahlreichen Datensätze ansehen, in denen Sie auf den Code von Personen in Kerneln zugreifen können. Die Foren in Kaggle sind hilfreich, wenn Leute über die Verwendung verschiedener Modelle für ein Problem und ihren Ansatz diskutieren.
https://www.kaggle.com/
quelle