Sei und Zufallsvariablen. ist die bedingte Mittelwert von gegeben . Wir sagen, ist nicht kausal mit wenn nicht von abhängt , was impliziert, dass es gleich . Lassen Sie uns nun für eine Sekunde mit dieser Definition der Kausalität fortfahren. Nach dem Gesetz der iterierten Erwartungen ist . Dies bedeutet, dass wenn nicht von abhängt , wenn es gleich , .X E ( Y | X ) Y X Y X E ( Y | X ) X E ( Y ) , E ( X E ( Y | X ) ) = E ( E ( X Y | X ) ) = E ( X Y ) E ( Y | X ) X E ( Y )
Mit anderen Worten:
Wenn und nicht kausal zusammenhängen, sind und nicht korreliert! - Das macht keinen Sinn und ich weiß, dass das falsch sein muss. Habe ich die Kausalität falsch definiert? Was habe ich falsch gemacht?Y X Y.
In der Ökonometrie nehmen wir im Allgemeinen . Also ist äquivalent zu . Die Logik gilt auch in diesem speziellen Szenario.E ( Y | X ) = E ( Y ) b 1 = 0
quelle
Antworten:
Sie haben die Kausalität falsch definiert, ja. Wahrscheinlich haben Sie das Sprichwort "Korrelation ist keine Kausalität" gehört. Sie haben Kausalität im Wesentlichen als Korrelation definiert. Das Problem ist jedoch schlimmer. Kausalität ist überhaupt kein statistisches oder probabilistisches Konzept, zumindest da diese Themen normalerweise gelehrt werden. Es gibt keine statistische oder probabilistische Definition der Kausalität: nichts, was bedingte Erwartungen oder bedingte Verteilungen oder ähnliches beinhaltet. Es ist jedoch schwierig, diese Tatsache aus Kursen in Statistik oder Ökonometrie aufzunehmen.
Leider neigen wir dazu, besser zu sagen, was Kausalität nicht ist als was Kausalität ist. Kausalität kommt immer und überall aus der Theorie, aus a priori Überlegungen, aus Annahmen. Sie haben die Ökonometrie erwähnt. Wenn Sie kompetent instrumentelle Variablen gelernt haben, wissen Sie, dass kausale Effekte nur gemessen werden können, wenn Sie eine "Ausschlussbeschränkung" haben. Und Sie wissen, dass Ausschlussbeschränkungen immer aus der Theorie stammen.
Sie sagten, Sie wollten Mathe. Der Typ, den Sie lesen möchten, ist Judea Pearl . Es ist keine einfache Mathematik, und die Mathematik wandert manchmal in die Philosophie ab, aber das liegt daran, dass Kausalität ein schwieriges Thema ist. Hier ist eine Seite mit weiteren Links zum Thema. Hier ist ein kostenloses Online-Buch, auf das ich gerade gestoßen bin. Schließlich ist hier eine vorherige Frage, in der ich eine Antwort gegeben habe, die Sie vielleicht nützlich finden.
quelle
Das ist falsch. Bei kausalen Beziehungen geht es um funktionale / strukturelle Abhängigkeiten, nicht um statistische / assoziative Abhängigkeiten. Sie sollten hier einen Blick darauf werfen.
Ja, Sie haben es falsch definiert. Hier können Sie kausale Inferenzbücher / Referenzen überprüfen . In einem Strukturgleichungsmodell Formal die kausale Wirkung von auf die Verteilung von Y , die wir mit bezeichnen kann P ( Y | d o ( X = x ) ) --- das heißt, wie die Änderung X wirkt sich auf die Verteilung von Y --- ist mathematisch definiert als die Wahrscheinlichkeitsverteilung, die durch das modifizierte Strukturgleichungsmodell induziert wird, wobei X = x durch die Gleichung für X ersetzt wird .X. Y. P.( Y.| do ( X.= x ) ) X. Y. X. X.= x
Angenommen, Ihr Kausalmodell wird durch die folgenden Strukturgleichungen definiert:
Wo die Störungen voneinander unabhängig sind und eine gewisse Wahrscheinlichkeitsverteilung haben. Dies entspricht der DAG:
Dann ist die Wahrscheinlichkeitsverteilung von Y durch die modifizierten Gleichungen Struktur induziert:P.( Y.| do ( X.= x ) ) Y.
Was der verstümmelten DAG entspricht:
Der durchschnittliche kausale Effekt wäre einfach die Erwartung von die kausalen CDF mit P ( Y | d o ( X = x ) ) .Y. P.( Y.| do ( X.= x ) )
Dies ist die mathematische Definition. Ob Sie den Effekt mit Beobachtungsdaten identifizieren können, hängt davon ab, ob Sie in Bezug auf die Beobachtungsverteilung ohne den Operator d o ( ) erneut ausdrücken können.P.( Y.| do ( X.= x ) ) do ( )
quelle
Ein Gegenbeispiel
Das Problem scheint nicht die mittlere Unabhängigkeit zu sein (die Bedingung, bei der ), impliziert, dass Y und X nicht korreliert sind. Wenn X und Y nicht korreliert sind, ist es im Allgemeinen nicht wahr, dass sie mittelunabhängig sind. Das scheint also bisher nicht problematisch zu sein.E.[ Y.| X.] = E.[ Y.]] Y. X. X. Y.
Angenommen, Sie hatten eine Beziehung (wir können sie als kausal bezeichnen) definiert als , wobei X mit einer Standardnormalverteilung und W mit einer Rademacher-Verteilung verteilt ist, so dass W = 1 oder - 1 , jeweils mit Wahrscheinlichkeit 1 / 2 ( siehe diesen Wikipedia - Artikel ). Beachten Sie dann, dass E [ Y | X ] = E [ Y ] . Nach Ihrer Definition wäre diese Beziehung keine Ursache, obwohl Y.Y.= W.X. X. W. W.= 1 - 1 1 / 2 E.[ Y.| X.] = E.[ Y.]] Y. hängt eindeutig von .X.
Ein Beispiel für eine formale Denkweise über Kausalität
Nehmen Sie das folgende Beispiel, um Ihnen eine klarere und mathematischere Möglichkeit zu geben, die Kausalität zu betrachten. (Ich leihe dieses Beispiel aus dem Buch "Mostly Harmless Econometrics" aus.) Angenommen, Sie möchten die Auswirkungen von Krankenhausaufenthalten auf die Gesundheit analysieren. Definieren Sie als ein Gesundheitsmaß für Person i und D i ∈ { 0 , 1 }, um anzugeben, ob diese Person ins Krankenhaus eingeliefert wurde oder nicht. Nehmen wir in unserem ersten Versuch an, wir betrachten den durchschnittlichen Gesundheitsunterschied der beiden Arten von Individuen: E [ Y i | D i = 1 ] - E [Y.ich ich D.ich∈ { 0 , 1 }
Beim ersten Blick auf die Daten werden Sie möglicherweise intuitiv feststellen, dass Personen, die ins Krankenhaus eingeliefert wurden, tatsächlich einen schlechteren Gesundheitszustand haben als Personen, die dies nicht getan haben. Ein Krankenhausaufenthalt macht die Menschen jedoch sicherlich nicht kranker. Vielmehr besteht eine Auswahlverzerrung. Menschen, die ins Krankenhaus gehen, sind Menschen mit schlechterer Gesundheit. Diese erste Maßnahme funktioniert also nicht. Warum? Weil wir nicht nur an denbeobachtetenUnterschiedeninteressiert sind, sondern an den möglichen Unterschieden (wir wollen wissen, was in der kontrafaktischen Welt passieren würde).
quelle
Ich sehe jedoch nicht, wo Ihr Problem liegt.
Beispiel: Betrachten Sie folgende Tabelle:
quelle