Ich bin ein Informatiker ohne Hintergrundwissen in Statistik oder fortgeschrittener Mathematik.
Ich studiere das Buch Python Machine Learning von Raschka und Mirjalili, aber als ich versuchte, die Mathematik des maschinellen Lernens zu verstehen, war ich nicht in der Lage, das großartige Buch zu verstehen, das mir ein Freund vorschlug: Die Elemente des statistischen Lernens .
Kennen Sie einfachere Statistiken und Mathematikbücher für maschinelles Lernen? Wenn nicht, wie soll ich umziehen?
Antworten:
Obwohl Sie ein Buch benötigen, empfehle ich die folgenden Kurse, um Statistiken zu verstehen, die für maschinelles Lernen und andere Aufgaben in der Datenwissenschaft verwendet werden. Sie sind frei.
Wenn ich ein Buch empfehlen möchte, würde ich das folgende Buch empfehlen, das unter CC-Lizenz kostenlos ist . Es hat schöne Beispiele und ist so praktisch; Darüber hinaus enthält es viele Codes, mit denen Sie Statistiken in realen Beispielen nachvollziehen können.
Denken Sie an Python von Allen B. Downey
Python Data Science-Handbuch
Auch der folgende Link kann helfen:
quelle
Einführung in die Lineare Algebra https://math.mit.edu/~gs/linearalgebra/ ist ein guter Ausgangspunkt. Stellen Sie sicher, dass Sie mit Wahrscheinlichkeitstheorie, linearer Algebra und Statistik vertraut sind. Sehr gründliche Kenntnisse sind möglicherweise nicht erforderlich, aber gute Kenntnisse sind erforderlich.
quelle
Bevor ich meinen Master in Analytics machte, wurde mir von meinen Vorgesetzten empfohlen, diese Bücher zu lesen, um mehr über maschinelles Lernen und Statistik zu erfahren.
Nämlich:
Wenn Sie diese Bücher online nicht finden können, teilen Sie mir den Link mit, ich habe sie auf meinem Laufwerk. Diese Bücher halfen mir, die Grundlagen von Statistiken mit Beispielen zu verstehen, die in Laienbegriffen erklärt wurden.
Wenn Sie nach Online-Kursen suchen, teilen Sie mir dies bitte mit, um einige gute Kurse vorzuschlagen (die meisten sind kostenlos).
quelle
Ich kann anhand Ihrer Frage nicht sagen, wie geschickt Sie in Mathematik sind oder wo Ihr Lernen aufhört. Ich gehe davon aus, dass Sie als Computer-Software-Ingenieur mit Algebra, Geometrie und vielleicht etwas Kalkül vertraut sind.
Ich würde empfehlen, dass Sie mit dem Lernen beginnen, indem Sie sich mit Statistiken vertraut machen und Konzepte wie Beschreibungen, explorative Datenanalyse, Korrelation, Verteilungen usw. verstehen. Ich sehe, dass Sie lieber Bücher als Videos sehen, also treffe ich Sie auf halbem Weg und versorge Sie mit ein paar Büchern, die online sind, sowie einem oder zwei Büchern, die Sie in gedruckter Form kaufen können.
Zunächst würde ich Penn State's Online-Lehrplan für Hochschulabsolventen in Statistik empfehlen . Sie können jeden ihrer Kurse über das Menü auf der linken Seite erkunden. Scrollen Sie nach Auswahl eines Kurses auf der Webseite des Kurses nach unten und klicken Sie auf den Link "Online-Kursnotizen". Die Kursnotizen für diese Kurse sind viel mehr als nur Notizen und lesen sich wie vollständige Bücher. Sie sind sehr lehrreich. Lesen Sie auch das Online-Curriculum für Bachelor-Studiengänge in Statistik von Penn State , falls Sie in den Abschlussarbeiten etwas zu Fortgeschrittenes finden und eine "einfachere" Erklärung wünschen.
Lesen Sie zweitens das Handbuch der biologischen Statistik von John H. McDonald. Lass dich nicht vom Titel täuschen. Dieses Buch ist eine exzellente Einführung in Statistik und Datenanalyse, die für jede Domain anwendbar ist.
Drittens lesen Sie das kleine Handbuch der Statistik von Gerard Dallal. Lassen Sie sich auch hier nicht vom Titel täuschen. Dieses Buch ist ein weiteres Juwel, das Sie durch einige wichtige statistische Grundlagen führt.
Viertens lesen Sie das Buch Think Stats von Allen Downey. Es gibt eine kostenlose Online-Version einer früheren Ausgabe. Die neueste Ausgabe, die Sie kaufen müssen. Es lohnt sich jedoch, besonders wenn Sie in Python arbeiten. In diesem Buch lehrt der Autor Sie die Statistik und Datenanalyse mit Python, um reale (Spielzeug-) Datensätze zu analysieren. Dies ist ein wirklich tolles Buch, um es durchzuarbeiten.
Schauen Sie sich zum Schluss Data Science from Scratch von Joel Grus an. Dieses Buch konzentriert sich mehr auf Datenanalyse (anstatt auf statistische Grundlagen) und legt einen größeren Schwerpunkt auf maschinelles Lernen und Modellieren. Es verwendet Python (und den Python Data Science Stack), um Sie durch die Analyse und Durchführung von Vorhersageanalysen für reale (Spielzeug-) Datensätze zu führen. Ein weiteres großartiges Buch zum Durcharbeiten.
quelle
Denken Sie daran, dass ich Ihnen, obwohl ich einen Master in angewandter Statistik habe, eine sehr einfache Antwort geben werde: Machen Sie einen Kurs über Wahrscheinlichkeiten.
Die meisten modernen ML-Programmier-Frameworks nehmen einen großen Teil der Mathematik aus der Datenwissenschaft heraus; Sie werden es in den meisten Szenarien einfach nicht brauchen. Sie müssen jedoch immer in der Lage sein, Ihre Ergebnisse zu verstehen, und die Mehrheit der Ergebnisse wird in Wahrscheinlichkeiten ausgedrückt. Wenn ich neu in der Datenwissenschaft wäre, würde ich einen (kurzen) Kurs über Wahrscheinlichkeiten machen, versuchen zu verstehen, was Proportionen und Prozentsätze wirklich bedeuten, und dann würde ich arbeiten, um ein Framework (wie Tensorflow) wirklich sehr gut zu kennen. Wenn Sie das können, können Sie einige wirklich interessante Algorithmen schreiben und müssen nicht zwanghaft in der Mathematik sein.
quelle