Ich möchte etwas über Wahrscheinlichkeitstheorie, Messtheorie und schließlich maschinelles Lernen lernen. Wo soll ich anfangen? [geschlossen]

9

Ich möchte etwas über Wahrscheinlichkeitstheorie, Messtheorie und schließlich maschinelles Lernen lernen. Mein oberstes Ziel ist es, maschinelles Lernen in einer Software zu verwenden.

Ich habe im College Analysis und sehr grundlegende Wahrscheinlichkeit studiert, aber das war es auch schon. Kennen Sie einige Online-Kurse oder Bücher, mit denen ich etwas über diese Themen lernen könnte? Ich habe viele Ressourcen im Web gefunden, aber sie scheinen alle auf ein Expertenpublikum ausgerichtet zu sein. Ich weiß, dass es einige Zeit dauern wird, aber wo fange ich an, wenn ich von Anfang an lernen möchte?

Max
quelle
2
Diese drei Fragen scheinen durch die von @General aufgelisteten Duplikate ziemlich gut abgedeckt zu sein.
whuber

Antworten:

13

Ich denke, es gibt zwei sehr gute und beliebte Referenzen für Sie (ich habe mit diesen begonnen und auch einen Master of Actuarial Science-Hintergrund):

  1. Eine Einführung in das statistische Lernen (mit Anwendung in R) von Gareth James, Daniela Witten, Trevor Hastie und Robert Tibshirani. Es ist auf der Website frei verfügbar, ziemlich umfassend und mit praktischen Beispielen leicht zu verstehen. Sie können viele Dinge auch ohne einen sehr starken statistischen Hintergrund lernen. Diese Referenz eignet sich für verschiedene Profile und enthält eine angemessene Anzahl gängiger Algorithmen sowie deren Implementierung in R, ohne tief in die mathematischen Details einzusteigen.

  2. Die Elemente des statistischen Lernens von Trevor Hastie, Robert Tibshirani und Jerome Friedman . Im Vergleich zum ersten geht dieses Buch tiefer in die mathematischen Aspekte ein, wenn Sie die speziellen Algorithmen, die Sie für nützlich halten, näher untersuchen möchten. (ist auch kostenlos )

Und natürlich ist Cross Validated für mich eine der besten Quellen, aus denen Sie viele Dinge lernen können: beste Praktiken, statistische Missverständnisse und Missbrauch und vieles mehr. Nach mehreren Jahren des Lernens an Schulen / Universitäten sowie des Selbstlernens stellte ich fest, dass mein Wissen zu begrenzt ist, als ich zum ersten Mal zu Cross Validated ging. Ich gehe seit dem ersten Besuch jeden Tag hierher und lerne so viel.

Metariat
quelle
3
Wenn Ihnen diese Referenzen gefallen, achten Sie auf die Online-Kurse von Stanford. T. Hastie und R. Tibshirani geben häufig Kurse zum Thema Maschinelles Lernen.
Marcel10
Ich habe ungefähr 20% von Eine Einführung in das statistische Lernen mit Anwendung in R gelesen. Genau das habe ich gesucht. Tolles Buch und ziemlich leicht zu verstehen. Ich danke dir sehr! :)
Max
6

Hier sind einige kostenlose Online-Kurse, von denen ich gehört habe, dass sie sehr zu empfehlen sind:

  • http://projects.iq.harvard.edu/stat110/home (Abhängig von Ihrem aktuellen Komfort mit der Wahrscheinlichkeitstheorie. Dr. Blitzsteins Kurs wurde in Harvard sehr beliebt, selbst für diejenigen, die sich nicht mit Statistiken / Wahrscheinlichkeit beschäftigten. Ich habe zugesehen ein paar der Vorträge für meine eigene Rezension und fanden sie sehr hilfreich.)
  • https://www.coursera.org/learn/machine-learning (Dies ist die aktuelle Version eines der ersten massiven Online-Kurse von Stanford von Andrew Ng, der schließlich Coursera mitbegründet hat. Ich wollte diesen Kurs belegen , aber ich hatte keine Zeit.)
Jab
quelle
5

Sie brauchen keine Maßtheorie. Die Maßtheorie wird von Mathematikern verwendet, um andere mathematische Verfahren zu rechtfertigen, z. B. das Eingrenzen von Integralnäherungen. Die meisten Ingenieure hätten die Maßtheorie nicht studiert, sondern nur die Ergebnisse verwendet. Die für ML erforderlichen mathematischen Kenntnisse sind grob dadurch gekennzeichnet, dass ein multivariater Gaußscher Wert integriert werden kann. Wenn Sie sich sicher sind, verfügen Sie wahrscheinlich über den erforderlichen Hintergrund für multivariablen Kalkül, lineare Algebra und Wahrscheinlichkeitstheorie.

Ich würde Think Stats von Allen Downey empfehlen - mit dem Ziel, Programmierern Wahrscheinlichkeit / Statistik beizubringen. Die Idee ist, Programmierkenntnisse für Simulationen zu nutzen und damit Wahrscheinlichkeitstheorie / statistische Methoden zu verstehen. Allen Downey Blog (er hat andere geschrieben) Think Statistiken (kostenlos) pdf )

seanv507
quelle
4
Die Messtheorie ist nützlich in zeitkontinuierlichen stochastischen Prozessen. Tatsächlich beginnt jedes Papier in der kontinuierlichen Zeitfinanzierung (Asset Pricing) mit dem folgenden Gebet(F,Ω,P)
Aksakal
@Aksakal meiner Meinung nach nicht nur kontinuierliche Prozesse!
Metariat
5

Da Sie sich für maschinelles Lernen interessieren, würde ich Wahrscheinlichkeit und Mesaure überspringen und direkt in die ML springen. Andrew Ngs Kurs ist ein großartiger Ort, um anzufangen. Sie können es buchstäblich in zwei Wochen beenden.

Spielen Sie ein paar Wochen mit dem, was Sie gelernt haben, und kehren Sie dann zu den Wurzeln zurück, um einige Wahrscheinlichkeiten zu untersuchen. Wenn Sie Ingenieur sind, bin ich verwirrt darüber, wie Sie es geschafft haben, im College einzusteigen. Früher war es der erforderliche Ingenieurkurs. Wie auch immer, Sie können hier den MIT OCW-Kurs belegen .

Ich glaube nicht, dass Sie eine Maßtheorie brauchen. Niemand braucht Maßtheorie. Diejenigen, die dies tun, werden nicht hierher kommen, um zu fragen, weil ihr Berater ihnen sagt, welchen Kurs sie nehmen sollen. Wenn Sie keinen Berater haben, brauchen Sie ihn definitiv nicht. Tautologie, aber wahr.

Die Sache mit einer Maßtheorie ist, dass man sie nicht durch "einfaches Lesen" lernen kann. Sie müssen die Übungen und Probleme machen, im Grunde genommen tun Sie es auf die harte Tour. Außerhalb des Klassenzimmers ist das meiner Meinung nach praktisch unmöglich. Die beste Option hier ist, eine Klasse am örtlichen College zu besuchen, wenn sie solche anbieten. Manchmal führt der Wahrscheinlichkeitskurs auf PhD-Niveau das Maß und die Wahrscheinlichkeiten in einer Klasse durch, was wahrscheinlich das beste Angebot ist. Ich würde nicht empfehlen, einen reinen Maßtheoriekurs in der Mathematikabteilung zu belegen, es sei denn, Sie möchten sich wirklich selbst quälen, obwohl Sie am Ende sehr zufrieden wären.

Aksakal
quelle
2

Für maschinelles Lernen denke ich, dass maschinelles Lernen: Die Kunst und Wissenschaft von Algorithmen, die Daten verstehen, von Peter Flach eine gute Ressource sein kann. Es bietet eine allgemeine Einführung in das maschinelle Lernen mit intuitiven Beispielen und ist für Anfänger geeignet. Ich mag dieses Buch besonders wegen des letzten Kapitels, das sich mit Experimenten zum maschinellen Lernen befasst. Beim Erlernen des maschinellen Lernens reicht es nicht aus, verschiedene Modelle kennenzulernen, und man sollte in der Lage sein, verschiedene Algorithmen für maschinelles Lernen zu vergleichen. Ich denke, dieses Buch hat es einfacher gemacht zu verstehen, wie man diese Algorithmen vergleicht. Vorlesungsfolien finden Sie hier .

user1219801
quelle
2

Um die obigen hervorragenden Vorschläge zu ergänzen, würde ich sagen, wenn Sie daran interessiert sind, grundlegendere Konzepte in Bezug auf Wahrscheinlichkeit und Statistik zu verstehen, ist "Von Algorithmen zu Z-Scores: Probabilistisches Rechnen in Statistiken" eine hervorragende Einführung in die Verwendung von Computern einige der wichtigsten Anfänger- / Zwischenkonzepte in der Wahrscheinlichkeitstheorie und in stochastischen Prozessen verstehen. Ich werde auch entweder "Eine Einführung in das statistische Lernen" oder "Elemente des statistischen Lernens" (ESL) als Einführung in das maschinelle Lernen (ML) unterstützen. Ich denke, dass insbesondere ESL erstaunlich ist, aber die ML-Konzepte sind viel mathematischer. Wenn Sie sich also nur bei Statistiken als "okay" betrachten, sollten Sie es lesen, sobald Sie mehr bekommen haben Erfahrung mit ML.

Wenn Sie sich für maschinelles Lernen interessieren, um beschäftigt zu sein oder Probleme zu lösen, ist es wichtig, praktische Erfahrungen zu sammeln. Machen Sie sich mit Datenwissenschaft / maschinellem Lernen vertraut. Andrew Ng macht in seinem Kurs bei Coursera hier eine erstaunliche Einführung in das maschinelle Lernen . Ich würde auch vorschlagen, dass Sie einige Datensätze herunterladen und damit herumspielen. Wenn Sie es noch nicht getan haben, laden Sie R und RStudio herunter (meiner Meinung nach für Anfänger freundlicher als Python oder Matlab), melden Sie sich bei kaggle an und lösen Sie einige ihrer Anfängerprobleme. Sie haben großartige exemplarische Vorgehensweisen, mit denen Sie ML verwenden können, ohne im Grunde eine Ahnung zu haben, was tatsächlich passiert. Sie erhalten jedoch eine Vorstellung davon, welche Schritte Sie unternehmen müssen, um eine ML-Lösung tatsächlich zu implementieren.

Ich persönlich würde eine Kombination aus der Verwendung von ML-Tools empfehlen, ohne wirklich zu wissen, was sie tun (mithilfe von Kaggle-Datensätzen oder ähnlichem). und grundlegende Konzepte wie Kreuzvalidierung, Überanpassung, Verwendung von Verwirrungsmatrizen, verschiedene Maße für die Qualität eines Modells usw. zu lernen. Für mich ist es viel wichtiger zu wissen, wie man die Algorithmen verwendet und wie man erkennt, wann Dinge funktionieren Ich arbeite nicht, als zu verstehen, wie die Algorithmen funktionieren.

Blue_vision
quelle