Maschinelles Lernen Kochbuch / Referenzkarte / Spickzettel?

57

Ich finde Ressourcen wie das Probability and Statistics Cookbook und die R Reference Card für Data Mining unglaublich nützlich. Sie dienen offensichtlich als Referenzen, helfen mir aber auch, meine Gedanken zu einem Thema zu ordnen und die Lage des Landes zu bestimmen.

F: Gibt es solche Ressourcen für Methoden des maschinellen Lernens?

Ich stelle mir eine Referenzkarte vor, die für jede ML-Methode Folgendes beinhalten würde:

  • Allgemeine Eigenschaften
  • Wenn die Methode gut funktioniert
  • Wenn die Methode schlecht tut
  • Von welchen oder zu welchen anderen Methoden verallgemeinert sich die Methode. Wurde es größtenteils abgelöst?
  • Vorarbeiten zur Methode
  • Offene Probleme im Zusammenhang mit der Methode
  • Rechenintensität

All diese Dinge lassen sich mit ein wenig Mühe in Lehrbüchern nachlesen, da bin ich mir sicher. Es wäre einfach sehr praktisch, sie auf ein paar Seiten zu haben.

lowndrul
quelle
5
Ein schönes Ziel, aber "ein Minimum an Lehrbüchern"? Wie könnte man überhaupt anfangen, diese 20 Bücher für statistisches Lernen und Data Mining + mloss.org/software/rating zu komprimieren ?
Denis
2
eine andere: stats.stackexchange.com/questions/19311/…
steffen 20.12.11
2
(+1) für die Chuzpa, wenn eine solche Übersicht existieren würde, würde ich dafür bezahlen. Das Hauptproblem besteht darin, dass neben einigen Eigenschaften, die sich aus dem Algorithmus selbst ableiten lassen, der Großteil dieser Eigenschaften oder Faustregeln durch Erfahrung, dh Anwendung, gewonnen wird. Ich bin mir ziemlich sicher, dass ein kampferprobter angewandter Forscher oder ML-Framework-Programmierer / Berater so etwas schreiben könnte ... aber hier und jetzt?
Steffen
@Denis: Der Link "20 Bücher .." funktioniert nicht. Können Sie das überprüfen?
lmsasu
6
Ich bin kein Experte für maschinelles Lernen, daher werde ich andere auffordern, Antworten zu veröffentlichen, aber ich denke, dass die Elemente des statistischen Lernens als ein guter Text zu diesem Thema angesehen werden und von einigen der größten Namen auf diesem Gebiet geschrieben werden. Ich sollte hinzufügen, dass dieses Buch auf hohem Niveau geschrieben ist und die, von denen ich gehört habe, empfehlen, dass sie in Statistik promoviert haben.
Makro

Antworten:

25

Einige der besten und frei verfügbaren Ressourcen sind:

In Bezug auf die Frage des Autors habe ich die Lösung "Alles auf einer Seite" nicht getroffen

Sergey
quelle
Sergey, ist Barbers Buch an Matlab gebunden?
Denis
2
Ja, werfen Sie einen Blick auf den Link des Buches: Die BRMLtool-Box soll den Lesern zeigen, wie sich mathematische Modelle in tatsächlichen MAT-LAB-Code umsetzen lassen.
Sergey
31

Wenn Sie maschinelles Lernen lernen möchten, rate ich Ihnen dringend, sich im Winter für den kostenlosen Online-ML-Kurs von Prof. Andrew Ng anzumelden .

Ich habe das vorige im Herbst gemacht, und das gesamte Lernmaterial ist von außergewöhnlicher Qualität und auf praktische Anwendungen ausgerichtet. Es ist viel einfacher, sich mit einem Buch allein herumzuschlagen.

Es ist auch eine ziemlich niedrig hängende Frucht mit guten intuitiven Erklärungen und einem Minimum an Mathematik.

Clyfe
quelle
Ich habe gerade diesen Kurs beendet und es ist großartig! Es gab mir auch einen großartigen Einstieg in das Verständnis von Büchern über maschinelles Lernen.
B Seven
1
Ich denke, dieser Link ist jetzt coursera.org/course/ml
n611x007
14

Ja, dir geht es gut; Christopher Bishops "Pattern Recognition and Machine Learning" ist ein ausgezeichnetes Buch, mit dem man nichts falsch machen kann.

Ein relativ junges, aber auch sehr gut geschriebenes und ebenso umfangreiches Buch ist David Barbers " Bayesian Reasoning and Machine Learning "; Ein Buch, das ich für etwas geeigneter halte, ist für einen Neuling auf diesem Gebiet.

Ich habe "The Elements of Statistical Learning" von Hastie et al. (von Macro erwähnt) und obwohl es ein sehr starkes Buch ist, würde ich es nicht als erste Referenz empfehlen; Vielleicht würde es Ihnen besser als zweite Referenz für spezialisiertere Themen dienen. In dieser Hinsicht kann David MacKays Buch Informationstheorie, Inferenz und Lernalgorithmen ebenfalls hervorragende Arbeit leisten.

usεr11852 sagt Reinstate Monic
quelle
2
+1 für Bischof. Klare Entwicklung mit gleichmäßiger Detailgenauigkeit. Ich fand Hastie et al. ein bisschen abgehackt.
Conjugateprior
1
+1 - Hastie, Tibshirani und Friedman sind meine persönlichen Favoriten.
StasK
1
+1 auch für Hastie, Tibshirani und Friedman, mein persönlicher Favorit zu empfehlen. Und danke für die anderen Empfehlungen; Ich werde sie lesen, weil ich wirklich ein gutes Buch brauche, das ich Nicht-Statistikern empfehlen kann (oder Personen, die gerade das Feld betreten).
Néstor,
1
+1 für Bischof. Tatsächlich ist es auch eine großartige Quelle für klassische Statistiken, aber aktualisiert und getarnt.
Vermutungen
10

Da der Konsens zu sein scheint, dass es sich bei dieser Frage nicht um ein Duplikat handelt, möchte ich meinen Favoriten für Anfänger mit Maschinenkenntnissen mitteilen:

Ich fand, dass das Programmieren von Collective Intelligence für Anfänger das einfachste Buch ist, da der Autor Toby Segaran sich darauf konzentriert, es dem mittleren Softwareentwickler zu ermöglichen, sich mit Datenhacken so schnell wie möglich die Hände schmutzig zu machen.

Typisches Kapitel: Das Datenproblem wird klar beschrieben, gefolgt von einer groben Erläuterung der Funktionsweise des Algorithmus, und schließlich wird gezeigt, wie Sie mit nur wenigen Codezeilen einige Erkenntnisse gewinnen.

Die Verwendung von Python ermöglicht es einem, alles ziemlich schnell zu verstehen (man muss Python nicht ernsthaft kennen, ich wusste es auch nicht vorher). Denken Sie nicht, dass dieses Buch sich nur auf die Erstellung eines Empfehlungssystems konzentriert. Es befasst sich auch mit Text Mining / Spam-Filterung / Optimierung / Clustering / Validierung usw. und gibt Ihnen somit einen ordentlichen Überblick über die grundlegenden Tools jedes Data Miners.

steffen
quelle
6

Witten und Frank, "Data Mining", Elsevier 2005 ist ein gutes Buch zum Selbstlernen, da es eine Java-Codebibliothek (Weka) gibt, die zu dem Buch gehört und sehr praxisorientiert ist. Ich vermute, es gibt eine neuere Ausgabe als die, die ich habe.

Dikran Beuteltier
quelle
1
Ja, dieses Buch sollte "Machine Learning" heißen, aber der Name wurde von den Herausgebern in "Data Mining" geändert, um dem damaligen Data Mining-Hype gerecht zu werden. sind aber andere felder!).
Clyfe
1
Tom Mitchells Buch "Machine Learning" ist ebenfalls sehr gut; Der Stil ist ein bisschen altmodisch, aber der Inhalt ist exzellent.
Dikran Marsupial
Ja, Tom Mitchells ML ist wie die ML-Bibel, wirklich umfassend auf dem Feld!
Clyfe
5

"Elemente des statistischen Lernens" wäre ein großartiges Buch für Ihre Zwecke. Die fünfte Ausgabe des Anfang 2011 erschienenen Buches ist kostenlos unter http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf erhältlich

DanB
quelle
2
Es ist ein mathematikintensives Buch, daher kann es für Selbstlernende schwierig sein, diesem Buch zu folgen.
Atilla Ozgur
Wissen Sie, wie es zufällig auf Trevor Hasties persönlichen Seiten frei herunterladbar ist, wenn Springer 70 $ dafür berechnet?
Alfred M.
Ich weiß es nicht genau, aber ich könnte mir vorstellen, dass Springer das Geld will und die Autoren ihr Buch hauptsächlich weithin veröffentlichen wollen. Dies scheint sehr ähnlich zu sein, wie Springer Ihnen veröffentlichte Artikel verkauft, während viele "Working Paper-Versionen" auf der Website des Autors frei verfügbar sind.
DanB
Zu Ihrer Information, der Download ist für den 5. Druck der zweiten Ausgabe vorgesehen. Ich liebe die Fußnote zum eipgraph "Auf Gott vertrauen wir, alle anderen bringen Daten", die Deming zugeschrieben wird. Die Fußnote weist auf die Ironie hin, dass keine "Daten" gefunden werden können, die bestätigen, dass Deming dies tatsächlich sagt.
HeatfanJohn
Sie sollten eine Einführung in das statistische Lernen mit R --it erwähnen, die ihrer ESL- Lite ähnelt (wenn die Mathematik in ESL zu entmutigend ist).
Steve S
5

Bildbeschreibung hier eingeben

Der schwierigste Teil bei der Lösung eines Problems des maschinellen Lernens ist oft, den richtigen Schätzer für den Job zu finden. Unterschiedliche Schätzer eignen sich besser für unterschiedliche Datentypen und unterschiedliche Probleme. Das folgende Flussdiagramm soll den Benutzern eine grobe Anleitung geben, wie sie Probleme angehen können, wenn es darum geht, welche Schätzer Sie für Ihre Daten verwenden sollten. Klicken Sie auf einen Schätzer in der folgenden Tabelle, um dessen Dokumentation anzuzeigen.

Anton Tarasenko
quelle
3

Die meisten Bücher, die in anderen Antworten erwähnt werden, sind sehr gut und mit keinem von ihnen kann man wirklich etwas falsch machen. Außerdem finde ich das folgende Spickzettel für Pythons scikit-learnziemlich nützlich.

Marc Claesen
quelle
2

Ich mag Duda, Hart und Stork "Pattern Classification". Dies ist eine aktuelle Überarbeitung eines klassischen Textes, der alles sehr gut erklärt. Ich bin nicht sicher, ob es so aktualisiert wurde, dass es viele neuronale Netze und SVMs abdeckt. Das Buch von Hastie, Tibshirani und Friedman ist das Beste, was es gibt, aber es ist vielleicht ein bisschen technischer als das, wonach Sie suchen. Es ist eher detailliert als ein Überblick über das Thema.

Michael Chernick
quelle
2

Microsoft Azure stellt auch ein ähnliches Spickzettelblatt zur Verfügung wie das von Anton Tarasenko.

Cheat Sheet für Microsoft Azure-Algorithmus für maschinelles Lernen

(Quelle: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Sie begleiten es mit einem Hinweis:

Die Vorschläge in diesem Algorithmus-Spickzettel sind ungefähre Faustregeln. Einige können verbogen werden, andere können offenkundig verletzt werden. Dies soll einen Ausgangspunkt vorschlagen. (...)

Microsoft stellt zusätzlich einen Einführungsartikel mit weiteren Details zur Verfügung.

Beachten Sie, dass sich diese Materialien auf die in Microsoft Azure implementierten Methoden konzentrieren.

Tim
quelle
1

Beginnen Sie nicht mit Elementen des statistischen Lernens. Es ist großartig, aber es ist ein Nachschlagewerk, das nicht so klingt, wie Sie es suchen. Ich würde mit dem Programmieren von Collective Intelligence beginnen, da es einfach zu lesen ist.

Neil McGuigan
quelle
Ich bin mir nicht sicher, ob ich ESL als Referenztext bezeichnen würde. Es scheint mir eher ein Überblick zu sein, dh Sie werden nicht die kleinsten Details von (kaum) etwas lernen. Sie werden die breiten Techniken und übergreifenden Themen sehen.
Kardinal
1

Für ein erstes Buch über maschinelles Lernen, das die Prinzipien gut erklärt, würde ich es wärmstens empfehlen

Rogers und Girolami, Ein erster Kurs in maschinellem Lernen (Chapman & Hall / CRC Machine Learning & Pattern Recognition), 2011.

Das Buch von Chris Bishop oder das von David Barber treffen gute Entscheidungen für ein Buch mit größerer Breite, wenn Sie die Prinzipien gut verstanden haben.

Dikran Beuteltier
quelle
0

Ich habe so eine Zusammenfassung geschrieben, aber nur für eine maschinelle Lernaufgabe (Netflix-Preis), und sie hat 195 Seiten: http://arek-paterek.com/book

Arek Paterek
quelle
0

Ein guter Spickzettel ist der in Max Kuhns Buch Applied Predictive Modeling . Das Buch enthält eine gute Übersichtstabelle mit mehreren ML-Lernmodellen. Die Tabelle befindet sich in Anhang A Seite 549.

PolBM
quelle