Welche mathematischen Fächer würden Sie vorschlagen, um sich auf Data Mining und maschinelles Lernen vorzubereiten?

30

Ich versuche, ein selbstgesteuertes Mathematik-Curriculum zusammenzustellen, um mich auf das Erlernen von Data Mining und maschinellem Lernen vorzubereiten. Dies ist darauf zurückzuführen , dass ich Andrew Ngs Maschinenlernkurs in Coursera begonnen habe und das Gefühl hatte, dass ich meine mathematischen Fähigkeiten verbessern musste, bevor ich weitermachen konnte. Ich habe vor einiger Zeit mein College abgeschlossen, daher sind meine Algebra und meine Statistiken (speziell aus den Bereichen Politikwissenschaft / Psychologie) verrostet.

Die Antworten im Thread Ist ein starker Hintergrund in Mathematik eine Grundvoraussetzung für ML? Schlagen Sie nur Bücher oder Kurse vor, die in direktem Zusammenhang mit maschinellem Lernen stehen. Ich habe einige dieser Klassen und Bücher bereits durchgesehen und weiß nicht genau, welches Mathematikfach studiert werden soll (zum Beispiel: Welche Felder der mathematischen Adresse, aus denen eine Gleichung zur "Minimierung einer Kostenfunktion" abgeleitet wird?). Der andere vorgeschlagene Thread ( Skills & Coursework musste ein Datenanalyst sein ) erwähnt nur breite Kategorien von Fähigkeiten, die für die Analyse von Daten erforderlich sind. Der Thread Einführung in die Statistik für Mathematiker entfällt, da ich noch keinen Abschluss in Mathematik habe. ein ähnlicher Thread Mathematiker möchte das äquivalente Wissen zu einem Grad der Qualitätsstatistik Ich habe eine unglaubliche Liste von Statistikbüchern, aber ich versuche, Mathe mit einer rostigen Erinnerung an Algebra zu beginnen und von dort aus weiterzugehen.

Welche Bereiche der Mathematik sind für diejenigen, die mit maschinellem Lernen und Data Mining arbeiten, für Ihre Arbeit von wesentlicher Bedeutung? Welche mathematischen Fächer würden Sie vorschlagen, um sich auf Data Mining und maschinelles Lernen vorzubereiten, und in welcher Reihenfolge? Hier ist die Liste und Reihenfolge, die ich bisher habe:

  • Algebra
  • Vorrechnung
  • Infinitesimalrechnung
  • Lineare Algebra
  • Wahrscheinlichkeit
  • Statistik (viele verschiedene Unterfelder hier, aber ich weiß nicht, wie ich sie aufteilen soll)

Was das Data Mining und das maschinelle Lernen betrifft, so habe ich durch meine aktuelle Tätigkeit Zugriff auf Aufzeichnungen über Website- / App-Aktivitäten, Kunden- / Abonnementtransaktionen und Immobiliendaten (sowohl statische als auch Zeitreihen). Ich hoffe, das Data Mining und das maschinelle Lernen auf diese Datasets anzuwenden.

Vielen Dank!

BEARBEITEN:

Der Nachwelt zuliebe wollte ich eine hilfreiche Selbsteinschätzung zu Geoffrey Gordons / Alex Smolas Einführung in das maschinelle Lernen an der CMU abgeben.

messen alles
quelle
3
In Bezug auf die Voraussetzungen für Coursera-Kurse sollten diese Informationen irgendwo in ihren Materialien verfügbar sein. Außerhalb ihrer Klassen / allgemeiner, erscheint mir die Frage, welche Mathematik Sie für stat / ML / DM benötigen, als Duplikat. Es gibt verschiedene Themen im Lebenslauf, die sich mit diesem Material befassen, darunter: ein starker Hintergrund in Mathematik, eine Voraussetzung für ml , und Fähigkeiten, die als Datenanalytiker benötigt werden ( vielleicht unter anderem).
gung - Wiedereinsetzung von Monica
1
Bitte überprüfen Sie diese Threads, die dort verlinkten Threads als eng verwandt und durchsuchen Sie möglicherweise die Website. Wenn Sie nach dem Lesen immer noch eine Frage haben, kehren Sie hierher zurück und bearbeiten Sie diese Frage, um die Unterscheidungskraft zu erhöhen.
gung - Wiedereinsetzung von Monica

Antworten:

15

Die Vorschläge, die @gung gemacht hat, sind es auf jeden Fall wert, weiterverfolgt zu werden. Nach Abschluss des Coursera-Kurses halte ich Ihre Liste für einen guten Anfang. Einige Kommentare:

  1. lineare Algebra und Matrixalgebra sind dasselbe, also lassen Sie letztere fallen.
  2. Achten Sie beim Rechnen darauf, eine partielle Differenzierung zu berücksichtigen. Dies ist ein Kalkül, der auf Funktionen von mehr als einer Variablen angewendet wird (wenn beispielsweise symbolisch eine Funktion von und dann möchten Sie anstelle von ). Zum Glück ist das nicht schwer.zxyzxdzdx
  3. Im Kalkül brauchen Sie nichts, was über die Grundintegration hinausgeht (und vielleicht auch nicht). Das ist ein Glück, denn die Integration ist schwierig.
  4. Hinzufügen grundlegender Optimierungen, dh Ermitteln des Maximums oder Minimums einer Funktion, normalerweise einer Funktion von mehr als einer Variablen. Eine Einschätzung des Gefälles zumindest ist unabdingbar.
  5. in Bezug auf die Schwierigkeit möchten Sie wahrscheinlich irgendwo zwischen Anfang und Ende des ersten Studienjahres sein.
  6. Versuchen Sie, einige grundlegende Wahrscheinlichkeits- und Statistiktexte online oder auf andere Weise zu lesen, aber sorgen Sie sich nicht zu sehr (Grundlegende Mathematik ist ohnehin eine Voraussetzung für das Verständnis von Wahrscheinlichkeit und Statistik). Wenn Sie Kurse wie den von Ihnen vorgeschlagenen machen, finden Sie heraus, was Sie lernen müssen und wo Ihre Interessen liegen. Eine Sache, die Sie zumindest zunächst nicht tun möchten, ist, viel Zeit mit dem Testen von Hypothesen zu verbringen. Sie möchten lieber das Verständnis grundlegender Statistiken fördern - Zufallsvariablen, Wahrscheinlichkeitsverteilungen (PFDs, CDFs), deskriptive Statistiken - und dann versuchen, die Regression zu verstehen.
TooTone
quelle
5

Es gibt ein paar ausgezeichneten Threads zu diesem forum-- einschließlich THIS ONE , dass ich besonders hilfreich für mich gefunden habe , in Bezug auf einen konzeptionellen Überblick über die wichtigsten Fähigkeiten für Daten Wissenschaft Arbeit zu entwickeln.

Wie oben erwähnt, stehen viele Online-Kurse zur Verfügung. Beispielsweise verfügt Coursera jetzt über eine Data Science-Spezialisierung mit einer Reihe von Kursen, in denen wahrscheinlich einige der Tools behandelt werden, die Sie für Ihre Arbeit benötigen.

GregF
quelle
3

Wenn Sie mehr über maschinelles Lernen / Data Mining erfahren möchten, würde ich dringend auf Optimierung / lineare Algebra / Statistik und Wahrscheinlichkeit drängen. Hier ist eine Liste von Büchern zur Wahrscheinlichkeit. Hoffentlich hilft das.

Brokkoli
quelle
3

Soweit ich sehr, sehr grundlegende mathematische Fähigkeiten unterrichte, verwende ich diese Bücher:

Elemente der Mathematik für Wirtschaft und Finanzen. Mavron, Vassilis C., Phillips, Timothy N. Dieses Buch behandelt grundlegende mathematische Fähigkeiten (Additionssubtraktion), partielle Differenzierung, Integration, Matrix und Determinanten sowie ein kleines Kapitel über Optimierung und auch Differentialgleichungen. Es ist auf Wirtschaft und Finanzen ausgerichtet, aber es ist ein kleines Buch, die Abfolge der Kapitel entspricht meinen Bedürfnissen und ist für mich einfach zu lesen.

Statistische Analyse: Microsoft Excel 2010. Conrad Carlberg Umfasst grundlegende statistische Analysen, multiple Regression und Analyse der Kovarianz und verwendet Excel.

Entdecken von Statistiken mit R. Andy Field, Jeremy Miles und Zoë Field. Habe es noch nicht gelesen. Es verwendet R.

Elementare Lineare Algebra. Ron Larson, David C. Falvo.

Matrixmethoden: Angewandte lineare Algebra Von Richard Bronson, Gabriel B. Costa. deckt elementare lineare Algebra und Matrixrechnung ab

Das sind die grundlegenden Mathematikbücher, mit denen ich mich auf Data Mining / maschinelles Lernen beziehe

Hoffe das hilft

Iwan
quelle
3

Es gibt eine ganze Reihe von relevanten Ressourcen aufgeführt (und kategorisierten) hier , bei der so genannten „Open Source Data Wissenschaft Masters“.

Speziell für die Mathematik listen sie auf:

  1. Lineare Algebra & Programmierung
  2. Statistiken
  3. Differentialgleichungen & Kalkül

Ziemlich allgemeine Empfehlungen, obwohl sie einige Lehrbücher auflisten, die Sie vielleicht nützlich finden.

anthr
quelle
2
  • Wahrscheinlichkeit und Statistik sind unerlässlich. Einige Schlüsselwörter sind Hypothesentest, multivariate Normalverteilung, Bayes'sche Inferenz (Gelenkwahrscheinlichkeit, bedingte Wahrscheinlichkeit), Mittelwert, Varianz, Kovarianz, Kullback-Leibler-Divergenz, ...
  • Grundlegende lineare Algebra ist für maschinelles Lernen unerlässlich. Themen, die Sie lernen könnten, sind Eigenzerlegung und Singularwertzerlegung. (Natürlich sollten Sie wissen, wie man ein Matrixprodukt berechnet.)
  • Wie TooTone bereits erwähnte: Optimierung ist wichtig. Sie sollten wissen, was Gradientenabstieg ist und vielleicht einen Blick auf Newtons Methode werfen, Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno.
  • Das Kalkül ist nicht so wichtig, aber es kann nützlich sein zu wissen, wie die partiellen Ableitungen von Funktionen (Jacobi-Matrix, Hesse-Matrix, ...) berechnet werden, und Sie sollten wissen, was ein Integral ist.
alfa
quelle
0

Lineare Algebra, Statistik, Analysis. Ich denke, Sie können sie im Tandem mit ML lernen - oder sogar nach den Grundlagen. Die Einsteigerkurse / -bücher machen einen tollen Job mit Mathe-Grundkapiteln, und Sie lernen die Grundlagen der Mathematik, während Sie ML lernen. Ich habe eine Podcast-Episode über die Mathematik, die Sie für maschinelles Lernen benötigen, und die Ressourcen für das Erlernen der Mathematik erstellt: Leitfaden zum maschinellen Lernen Nr. 8

lefnire
quelle
0

Bevor Sie einen maschinellen Lernkurs beginnen, müssen Sie den folgenden Mathematikkurs absolvieren. Versuchen Sie auch nicht, in einem Versuch zu graben. Erlernen Sie grundlegende Konzepte und verbessern Sie dann erneut Ihre mathematischen Fähigkeiten. Wiederholen Sie:

Mathematik-Themen sind wie folgt: -

  • Lineare Algebra
  • Wahrscheinlichkeit
  • Grundrechnung
  • Maxima und Minima der Funktion
Nikhil Agrawal
quelle