Was ist der Unterschied zwischen Ökonometrie und maschinellem Lernen?

8

Nach meinem Verständnis schätzt die Ökonometrie partielle ( ceteris paribus ) Korrelationen mit dem Ziel, primär kausale Zusammenhänge abzuschätzen . Dafür wird normalerweise der gesamte verfügbare Datensatz verwendet . Ökonometrie kann parametrisch und nicht parametrisch sein.

In der Zwischenzeit interessiert sich maschinelles Lernen nicht für Kausalität, sondern für "Fit" mit dem Ziel, in erster Linie Vorhersagen zu treffen . Dafür wird normalerweise der Datensatz zwischen dem Trainings- und dem Vorhersagesatz aufgeteilt. Maschinelles Lernen kann auch parametrisch und nicht parametrisch sein.


Das kann ich aus dem Kern dieser beiden Disziplinen machen, aber ich bin mir sicher, dass noch viel mehr dahinter steckt. Ich interessiere mich hauptsächlich für ihre Unterschiede. Kann jemand bitte einen guten Leitfaden dazu geben?

Luchonacho
quelle
8
Ich würde vermuten, dass Ökonometrie ein Fach oder eine Disziplin ist, während maschinelles Lernen eine Familie von Methoden ist. Sie können maschinelles Lernen in der Ökonometrie sowie in anderen Fachgebieten verwenden, und Sie können andere Methoden in der Ökonometrie verwenden
Henry
4
Ragnar Frisch schrieb in der ersten Ausgabe von Econometrica, dass es in der Ökonometrie um Folgendes geht: "Wirtschaftstheorie in ihrem Verhältnis zu Statistik und Mathematik". Ökonometrische Modelle stammen daher häufig aus der Wirtschaftstheorie oder der Mathematik / Spieltheorie, bevor sie an Daten angepasst werden. Statistik und maschinelles Lernen sind jedoch datengesteuert und nicht theoretisch. Meiner Meinung nach ist dies der wichtigste Unterschied. In der Ökonometrie gibt es auch Vorhersagemodelle (im Gegensatz zu Erklärungsmodellen) oder flexible Modelle (die geschult / validiert werden müssen). Sie sind jedoch nur ein Teil der verwendeten Methoden.
Achim Zeileis
1
Was ist der Unterschied zwischen einer Banane und Früchten? Ökonometrie ist ein Teilgebiet des maschinellen Lernens ...
Antoine
3
@Antoine Ich würde eher argumentieren, dass maschinelles Lernen ein Teilgebiet der Ökonometrie ist ...
rbm
4
@Antoine du kannst es nicht ernst meinen. Ich habe das Problem der statistischen Tests noch nie in einem Buch gesehen, das sich selbst als "maschinelles Lernen" bezeichnete
Tomka

Antworten:

4

Das wichtigste zuerst. Alles, was ich sage, ist nur mein Verständnis. Daher kann ich mich wie immer irren.

Henry hat teilweise recht. Ökonometrie ist aber auch eine Methodenfamilie. Abhängig von der jeweiligen Forschungsfrage und den bereitgestellten Daten (Querschnitt vs. Paneldaten usw.) können verschiedene ökonometrische Methoden angewendet werden.

Maschinelles Lernen ist nach meinem Verständnis eine Sammlung von Methoden, mit denen Maschinen Muster aus früheren Beobachtungen lernen können (oft auf Black-Box-Weise). Regression ist ein Standardwerkzeug in der Ökonometrie sowie im maschinellen Lernen, da es ermöglicht, Beziehungen zwischen Variablen zu lernen und diese Beziehungen in die Zukunft zu extrapolieren.

Nicht alle Ökonomen sind an einer kausalen Interpretation von Parameterschätzungen interessiert (sie können selten eine kausale Interpretation beanspruchen, wenn Beobachtungsdaten (nicht experimentell) verwendet werden). Wie bei Zeitreihendaten kümmern sich auch Ökonomen häufig nur um die prädiktive Leistung.

Im Wesentlichen sind beide gleich, aber in verschiedenen Teilbereichen entwickelt (maschinelles Lernen wurzelt in der Informatik). Sie sind beide eine Sammlung von Methoden. Ökonomen verwenden zunehmend auch Methoden des maschinellen Lernens wie Entscheidungsbäume und neuronale Netze.

Sie haben bereits einen sehr interessanten Punkt angesprochen: Kausalität. Im Wesentlichen möchten beide Bereiche die wahren zugrunde liegenden Beziehungen kennen, aber wie Sie bereits erwähnt haben, ist häufig die Vorhersageleistung der Haupt-KPI, der bei maschinellen Lernaufgaben verwendet wird. Das heißt, ein geringer Generalisierungsfehler ist das Hauptziel. Wenn Sie die wahren Kausalzusammenhänge kennen, sollte dies natürlich den geringsten Generalisierungsfehler unter allen möglichen Formulierungen aufweisen. Die Realität ist sehr komplex und es gibt keine freie Ahnung. Daher haben wir die meiste Zeit nur teilweise Kenntnis des zugrunde liegenden Systems und können manchmal nicht einmal die wichtigsten Einflüsse messen. Wir können jedoch Proxy-Variablen verwenden, die mit den tatsächlichen zugrunde liegenden Variablen korrelieren, die wir messen möchten.

Lange Rede, kurzer Sinn und sehr, sehr oberflächlich: Beide Bereiche sind miteinander verbunden, während Ökonomen hauptsächlich daran interessiert sind, die wahren Kausalzusammenhänge zu finden (dh einige Hypothesen zu testen), während maschinelles Lernen eher in der Informatik verwurzelt ist und sich hauptsächlich für das Bauen von Systemen mit geringen Werten interessiert Generalisierungsfehler.

PS: Die Verwendung nur des gesamten Datensatzes in der Ökonometrie sollte generell ebenfalls vermieden werden. Ökonomen werden sich zunehmend bewusst, dass Beziehungen, die in Beispielen gefunden wurden, nicht unbedingt auf neue Daten verallgemeinert werden müssen. Daher war und ist die Replikation ökonometrischer Studien sehr wichtig.

Hoffe das hilft in irgendeiner Weise.

Nur ich
quelle
Achim kommentierte, dass ML wenig (wenn überhaupt nicht) von der Theorie getrieben wird, was Sie nicht sagen. Können Sie das näher erläutern? Das ist wahrscheinlich ein Kernelement der Analyse.
Luchonacho
@ Luchonacho dies wird in meinem Hinweis auf diese Antwort
angesprochen
@ Luchonacho Tomka machte dort einen sehr guten Punkt. Dennoch möchte ich die Tatsache betonen (und Tomka hat dies auch bereits erwähnt), dass beide Bereiche an Kausalität interessiert sein sollten und sind. In maschinellen Lernbegriffen: Die Kenntnis der wahren Kausalzusammenhänge sollte zu einem Modell mit der geringsten Verzerrung und Varianz führen. Ein wirklich wichtiger Schritt bei jeder Anwendung des Maschinellen Lernens ist der Feature-Feature-Engineering-Schritt, der von der Theorie gesteuert werden sollte, unabhängig davon, aus welchem ​​Bereich Sie stammen.
JustMe
kleine Sache zum Hinzufügen (die Sie im Absatz vor dem ps angesprochen haben): Unterschiede in der Sorge, wo sich die Voreingenommenheit befindet. In ML Bedenken hinsichtlich der Verzerrung im Modell (z. B. rmse); In der Ökonometrie Bedenken hinsichtlich der Verzerrung des interessierenden Parameters und des Potenzials für die Verzerrung ausgelassener Variablen. Generell natürlich.
Paqmo
2

Einige Hinweise zusätzlich zu @JustMe:

Erstens gibt es auf beiden Seiten der Ökonometrie und des maschinellen Lernens viel Arroganz. Es ist zwecklos zu diskutieren, welche der beiden eine Unterdisziplin sein kann. Tatsächlich sind beide stark überlappende Unterdisziplinen des Statistikbereichs (der am besten als angewandte Mathematik beschrieben wird). Beide haben ihre eigenen Schwerpunkte und Präferenzen, z. B. konzentriert sich die Ökonometrie auf Schätz- und Testhypothesen, häufig in kleineren Stichproben, während sich ML auf die beste funktionale Approximation konzentriert, häufig in großen Stichproben. Die erste konzentriert sich auf parametrische Methoden, die Verteilungsannahmen treffen, die zweite häufiger (aber bei weitem nicht ausschließlich) auf nichtparametrische verteilungsfreie Methoden. Und so weiter.

Zweitens, wenn das Ziel die Vorhersage ist, besteht keine inhärente Notwendigkeit, die Kausalität zu verstehen, solange Zufallsstichproben aus derselben Population verfügbar sind. Das Verständnis der Kausalität ist jedoch von zentralem Interesse, wenn wir ein System verstehen (dh Theorieentwicklung / -prüfung) oder es ändern wollen (dh durch eine Intervention auf die Theorie einwirken). Diese Art von Forschungsziel ist in der Ökonometrie (und anderen Bereichen wie der Biostatistik) weitaus häufiger als beim maschinellen Lernen.

Es gibt jedoch auch Forscher für maschinelles Lernen, die sich für Kausalität interessieren. Der Hauptunterschied zwischen den Feldern besteht wiederum darin, dass Ökonomen Hypothesen über Interventionen haben und versuchen, ihre Auswirkungen abzuschätzen (z. B. anhand von Beobachtungsdaten oder experimentellen Daten unter Verwendung von Techniken aus der kausalen Inferenztheorie wie Gewichtung, Matching oder Auswahlmodelle), wohingegen maschinelles Lernen dies tun würde Versuchen Sie lieber, kausale Zusammenhänge aus den Daten zu lernen (z. B. mithilfe von Suchalgorithmen in gerichteten azyklischen kausalen Graphen), und der Fokus liegt weniger stark auf einer einzelnen Intervention.

Tomka
quelle