Welche Kausaltheorien sollte ich kennen?

16

Welche theoretischen Herangehensweisen an die Kausalität sollte ich als angewandter Statistiker / Ökonometriker kennen?

Ich kenne die (ein bisschen)

Welche Konzepte vermisse ich oder sollte ich darauf achten?

Verwandte: Welche Theorien sind Grundlagen für Kausalität im maschinellen Lernen?

Ich habe diese interessanten Fragen und die Antworten ( 1 , 2 , 3 ) gelesen , denke aber, dass dies eine andere Frage ist. Und ich war sehr überrascht zu sehen, dass "Kausalität" beispielsweise in Elements of Statistical Learning nicht erwähnt wird .

Arne Jonas Warnke
quelle
2
Lesen Sie Andrew Gelmans Übersichtsartikel über mehrere Arbeiten zur Kausalität in AJS: Gelman, A. (2011). Kausalität und statistisches Lernen. American Journal of Sociology, 117 (3), 955 & ndash; 966. doi: 10.1086 / 662659 . Es ist ein kurzer Überblick über die sozialwissenschaftliche Kausalität mit spezifischen Hinweisen auf Rubins und Perles Werke sowie einige andere. Ein guter Ort, um die Referenzen zu durchsuchen.
Paqmo
1
Zunächst die Methoden von (John Stuart) Mill. en.wikipedia.org/wiki/Mill's_Methods
noumenal
Siehe meinen Kommentar unter der akzeptierten Antwort bezüglich einer möglichen Fehlinterpretation der Granger-Kausalität dort.
Richard Hardy

Antworten:

17

B

Während es fast unumstritten ist, dass eine Ursache ihrer Wirkung zeitlich vorausgehen muss, müssen Sie, um kausale Schlussfolgerungen zeitlich vorrangig ziehen zu können, neben anderen Quellen von falschen Assoziationen auch das Fehlen von Verwechslungen geltend machen.

In Bezug auf die potenziellen Ergebnisse (Neyman-Rubin) im Vergleich zu Kausaldiagrammen / Strukturgleichungsmodellierung (Pearl) würde ich sagen, dass dies ein falsches Dilemma ist und Sie beides lernen sollten.

Zunächst ist zu beachten, dass dies keine gegensätzlichen Ansichten über die Kausalität sind . Wie Pearl es ausdrückt, gibt es eine Hierarchie in Bezug auf (kausale) Inferenzaufgaben:

  1. Beobachtungsvorhersage
  2. Vorhersage unter Befragung
  3. Counterfactuals

Für die erste Aufgabe müssen Sie nur die gemeinsame Verteilung der beobachteten Variablen kennen. Für die zweite Aufgabe müssen Sie die gemeinsame Verteilung und die Kausalstruktur kennen. Für die letzte Aufgabe der Kontrafakten benötigen Sie außerdem einige Informationen zu den Funktionsformen Ihres Strukturgleichungsmodells.

Wenn es also um Kontrafakten geht, gibt es eine formale Äquivalenz zwischen beiden Perspektiven . Der Unterschied besteht darin, dass potenzielle Ergebnisse kontrafaktische Aussagen als Primitive annehmen und in DAGs Kontrafaktiken aus den Strukturgleichungen abgeleitet zu sein scheinen . Sie könnten sich jedoch fragen, ob sie "gleichwertig" sind, warum Sie sich die Mühe machen, beide zu lernen? Weil es Unterschiede in Bezug auf die "Leichtigkeit" gibt, Dinge auszudrücken und abzuleiten.

Versuchen Sie beispielsweise, das Konzept von M-Bias nur mit potenziellen Ergebnissen auszudrücken. Ich habe noch nie ein gutes Ergebnis gesehen. Bisher habe ich die Erfahrung gemacht, dass Forscher, die sich noch nie mit Grafiken befasst haben, sich dessen nicht einmal bewusst sind. Wenn Sie die inhaltlichen Annahmen Ihres Modells in die grafische Sprache umwandeln, können Sie die empirisch überprüfbaren Implikationen des Modells rechnerisch leichter ableiten und Fragen der Identifizierbarkeit beantworten. Andererseits fällt es den Menschen manchmal leichter, zunächst direkt an die Kontrafakten selbst zu denken und diese mit parametrischen Annahmen zu kombinieren, um sehr spezifische Fragen zu beantworten.

Man könnte noch viel mehr sagen, aber der Punkt hier ist, dass Sie lernen sollten, wie man "beide Sprachen spricht". Referenzen finden Sie hier.

Carlos Cinelli
quelle
1
Könnten Sie ein Beispiel für etwas geben, das sich leicht in Form von Bestellungen, aber nicht in DAGs ausdrücken lässt?
Guilherme Duarte
@ GuilhermeDuarte Vermittlungsmengen mit verschachtelten Kontrafakten zum Beispiel
Carlos Cinelli
3
AGrangerBABB
@RichardHardy Ich denke, Sie haben recht, vielleicht könnte ein perfekter Hahn, der immer eine Stunde vor Sonnenaufgang kräht, eine Vorhersagekraft haben, die über ein lineares Modell von Sonnenaufgang-Zeitreihen hinausgeht (da der Sonnenaufgang nicht jeden Tag exakt gleich ist), sondern mit einem perfekten Modell es fügt wahrscheinlich nichts hinzu.
Carlos Cinelli
Ich denke, Granger-Kausalität schlägt nicht vor, minderwertige Vorhersagemodelle nur mit der Vorgeschichte von B zu verwenden, um die Notwendigkeit einer zusätzlichen Variablen A und damit Granger-Kausalität zu rechtfertigen. Vielmehr würde man im Idealfall ein möglichst gutes Modell unter Verwendung der eigenen Geschichte von B anstreben und dann sehen, ob das Hinzufügen von A (in irgendeiner Form) die Vorhersage von B erleichtert. Und natürlich ist "ein perfekter Hahn" ein eher utopisches Konzept. Angesichts dessen halte ich es für eine gute Idee, die Antwort so zu ändern, dass sie dies widerspiegelt.
Richard Hardy