Ich hatte das Verständnis, dass der Hauptunterschied zwischen maschinellem Lernen und statistischem Modell darin besteht, dass das spätere eine bestimmte Art der Datenverteilung "annimmt" und auf diesem unterschiedlichen Modellparadigma sowie statistischen Ergebnissen basiert, die wir erhalten (z. B. p-Werte, F-Statistik) , t-stat usw.). Beim maschinellen Lernen kümmern wir uns jedoch nicht um die Verteilung von Daten und interessieren uns mehr für Vorhersagen.
Als ich Mllib doc durchgesehen habe, habe ich festgestellt, dass wir für die lineare Regression eine Verteilung angeben. Aber Mllib ist ein Paket für maschinelles Lernen. Ich habe also folgende Fragen:
1) Ist mein Verständnis zwischen ML und statistischer Methode falsch?
2) Verwendet Spark statistische Modelle für lineare Regression und GLMs?
Vielen Dank!
Hinweis: Es gibt viele wunderbare Beiträge zum Unterschied zwischen maschinellem Lernen und statistischen Methoden. Dies hängt jedoch eher mit dem Funken MLLIB zusammen.