Nach meinem Verständnis schätzt die Ökonometrie partielle ( ceteris paribus ) Korrelationen mit dem Ziel, primär kausale Zusammenhänge abzuschätzen . Dafür wird normalerweise der gesamte verfügbare Datensatz verwendet . Ökonometrie kann parametrisch und nicht parametrisch sein.
In der Zwischenzeit interessiert sich maschinelles Lernen nicht für Kausalität, sondern für "Fit" mit dem Ziel, in erster Linie Vorhersagen zu treffen . Dafür wird normalerweise der Datensatz zwischen dem Trainings- und dem Vorhersagesatz aufgeteilt. Maschinelles Lernen kann auch parametrisch und nicht parametrisch sein.
Das kann ich aus dem Kern dieser beiden Disziplinen machen, aber ich bin mir sicher, dass noch viel mehr dahinter steckt. Ich interessiere mich hauptsächlich für ihre Unterschiede. Kann jemand bitte einen guten Leitfaden dazu geben?
quelle
Antworten:
Das wichtigste zuerst. Alles, was ich sage, ist nur mein Verständnis. Daher kann ich mich wie immer irren.
Henry hat teilweise recht. Ökonometrie ist aber auch eine Methodenfamilie. Abhängig von der jeweiligen Forschungsfrage und den bereitgestellten Daten (Querschnitt vs. Paneldaten usw.) können verschiedene ökonometrische Methoden angewendet werden.
Maschinelles Lernen ist nach meinem Verständnis eine Sammlung von Methoden, mit denen Maschinen Muster aus früheren Beobachtungen lernen können (oft auf Black-Box-Weise). Regression ist ein Standardwerkzeug in der Ökonometrie sowie im maschinellen Lernen, da es ermöglicht, Beziehungen zwischen Variablen zu lernen und diese Beziehungen in die Zukunft zu extrapolieren.
Nicht alle Ökonomen sind an einer kausalen Interpretation von Parameterschätzungen interessiert (sie können selten eine kausale Interpretation beanspruchen, wenn Beobachtungsdaten (nicht experimentell) verwendet werden). Wie bei Zeitreihendaten kümmern sich auch Ökonomen häufig nur um die prädiktive Leistung.
Im Wesentlichen sind beide gleich, aber in verschiedenen Teilbereichen entwickelt (maschinelles Lernen wurzelt in der Informatik). Sie sind beide eine Sammlung von Methoden. Ökonomen verwenden zunehmend auch Methoden des maschinellen Lernens wie Entscheidungsbäume und neuronale Netze.
Sie haben bereits einen sehr interessanten Punkt angesprochen: Kausalität. Im Wesentlichen möchten beide Bereiche die wahren zugrunde liegenden Beziehungen kennen, aber wie Sie bereits erwähnt haben, ist häufig die Vorhersageleistung der Haupt-KPI, der bei maschinellen Lernaufgaben verwendet wird. Das heißt, ein geringer Generalisierungsfehler ist das Hauptziel. Wenn Sie die wahren Kausalzusammenhänge kennen, sollte dies natürlich den geringsten Generalisierungsfehler unter allen möglichen Formulierungen aufweisen. Die Realität ist sehr komplex und es gibt keine freie Ahnung. Daher haben wir die meiste Zeit nur teilweise Kenntnis des zugrunde liegenden Systems und können manchmal nicht einmal die wichtigsten Einflüsse messen. Wir können jedoch Proxy-Variablen verwenden, die mit den tatsächlichen zugrunde liegenden Variablen korrelieren, die wir messen möchten.
Lange Rede, kurzer Sinn und sehr, sehr oberflächlich: Beide Bereiche sind miteinander verbunden, während Ökonomen hauptsächlich daran interessiert sind, die wahren Kausalzusammenhänge zu finden (dh einige Hypothesen zu testen), während maschinelles Lernen eher in der Informatik verwurzelt ist und sich hauptsächlich für das Bauen von Systemen mit geringen Werten interessiert Generalisierungsfehler.
PS: Die Verwendung nur des gesamten Datensatzes in der Ökonometrie sollte generell ebenfalls vermieden werden. Ökonomen werden sich zunehmend bewusst, dass Beziehungen, die in Beispielen gefunden wurden, nicht unbedingt auf neue Daten verallgemeinert werden müssen. Daher war und ist die Replikation ökonometrischer Studien sehr wichtig.
Hoffe das hilft in irgendeiner Weise.
quelle
Einige Hinweise zusätzlich zu @JustMe:
Erstens gibt es auf beiden Seiten der Ökonometrie und des maschinellen Lernens viel Arroganz. Es ist zwecklos zu diskutieren, welche der beiden eine Unterdisziplin sein kann. Tatsächlich sind beide stark überlappende Unterdisziplinen des Statistikbereichs (der am besten als angewandte Mathematik beschrieben wird). Beide haben ihre eigenen Schwerpunkte und Präferenzen, z. B. konzentriert sich die Ökonometrie auf Schätz- und Testhypothesen, häufig in kleineren Stichproben, während sich ML auf die beste funktionale Approximation konzentriert, häufig in großen Stichproben. Die erste konzentriert sich auf parametrische Methoden, die Verteilungsannahmen treffen, die zweite häufiger (aber bei weitem nicht ausschließlich) auf nichtparametrische verteilungsfreie Methoden. Und so weiter.
Zweitens, wenn das Ziel die Vorhersage ist, besteht keine inhärente Notwendigkeit, die Kausalität zu verstehen, solange Zufallsstichproben aus derselben Population verfügbar sind. Das Verständnis der Kausalität ist jedoch von zentralem Interesse, wenn wir ein System verstehen (dh Theorieentwicklung / -prüfung) oder es ändern wollen (dh durch eine Intervention auf die Theorie einwirken). Diese Art von Forschungsziel ist in der Ökonometrie (und anderen Bereichen wie der Biostatistik) weitaus häufiger als beim maschinellen Lernen.
Es gibt jedoch auch Forscher für maschinelles Lernen, die sich für Kausalität interessieren. Der Hauptunterschied zwischen den Feldern besteht wiederum darin, dass Ökonomen Hypothesen über Interventionen haben und versuchen, ihre Auswirkungen abzuschätzen (z. B. anhand von Beobachtungsdaten oder experimentellen Daten unter Verwendung von Techniken aus der kausalen Inferenztheorie wie Gewichtung, Matching oder Auswahlmodelle), wohingegen maschinelles Lernen dies tun würde Versuchen Sie lieber, kausale Zusammenhänge aus den Daten zu lernen (z. B. mithilfe von Suchalgorithmen in gerichteten azyklischen kausalen Graphen), und der Fokus liegt weniger stark auf einer einzelnen Intervention.
quelle