Wenn dies der Fall ist, bedeutet statistische Unabhängigkeit dann automatisch einen Mangel an Kausalität?
Nein, und hier ist ein einfaches Gegenbeispiel mit einer multivariaten Normalen:
set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)
Mit entsprechendem Diagramm
Hier haben wir, dass und geringfügig unabhängig sind (im multivariaten Normalfall impliziert die Nullkorrelation Unabhängigkeit). Dies geschieht, weil der Backdoor-Pfad über den direkten Pfad von nach genau aufhebt , d. . Somit ist . Doch verursacht direkt , und wir haben , dass , die aus unterschiedlichen ist .xyzxycov(x,y)=b−a∗c=0.1−0.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0
Assoziationen, Interventionen und Kontrafakten
Ich halte es für wichtig, hier einige Klarstellungen zu Assoziationen, Interventionen und Kontrafakten vorzunehmen.
Kausalmodelle beinhalten Aussagen über das Verhalten des Systems: (i) unter passiven Beobachtungen, (ii) unter Interventionen sowie (iii) Kontrafakten. Und Unabhängigkeit auf einer Ebene bedeutet nicht unbedingt, dass sie auf die andere übertragen wird.
Wie das obige Beispiel zeigt, können wir keine Assoziation zwischen und , dh , und es kann immer noch der Fall eintreten, dass Manipulationen an die Verteilung von , dh ändern .XYP(Y|X)=P(Y)XYP(Y|do(x))≠P(Y)
Jetzt können wir noch einen Schritt weiter gehen. Wir können Kausalmodelle haben, bei denen das Eingreifen in die Populationsverteilung von nicht verändert , aber dies bedeutet nicht, dass keine kontrafaktische Kausalität vorliegt! Das heißt, obwohl , wäre das Ergebnis von für jedes Individuum anders gewesen, wenn Sie sein geändert hätten . Dies ist genau der Fall, der von user20160 sowie in meiner vorherigen Antwort hier beschrieben wurde.XYP(Y|do(x))=P(Y)YX
Diese drei Ebenen bilden eine Hierarchie von kausalen Inferenzaufgaben in Bezug auf die Informationen, die für die Beantwortung der jeweiligen Fragen benötigt werden.
Angenommen, wir haben eine Glühbirne, die von zwei Schaltern gesteuert wird. Lassen und bezeichnen den Zustand der Schalter, die entweder 0 oder 1 sein kann Let den Zustand des lighbulb bezeichnen, die entweder sein können 0 (aus) oder 1 (ein). Wir haben die Schaltung so eingerichtet, dass die Glühbirne eingeschaltet ist, wenn sich die beiden Schalter in unterschiedlichen Zuständen befinden, und ausgeschaltet, wenn sie sich in demselben Zustand befinden. Die Schaltung implementiert also die Exklusiv- oder Funktion: .S1 S2 L L=XOR(S1,S2)
Konstruktionsbedingt ist kausal mit und . Bei jeder Konfiguration des Systems ändert sich der Zustand der Glühbirne, wenn Sie einen Schalter umlegen.L S1 S2
Angenommen, beide Schalter werden nach einem Bernoulli-Verfahren unabhängig voneinander betätigt, wobei die Wahrscheinlichkeit, im Zustand 1 zu sein, 0,5 beträgt. Also ist und und sind unabhängig. In diesem Fall wissen wir aus dem Entwurf der Schaltung, dass und außerdem . Das heißt, wenn wir den Status eines Schalters kennen, wissen wir nicht, ob die Glühbirne ein- oder ausgeschaltet ist. Also sind und unabhängig, ebenso wie und .p(S1=1)=p(S2=1)=0.5 S1 S2 P(L=1)=0.5 p(L∣S1)=p(L∣S2)=p(L) L S1 L S2
Aber wie oben ist kausal mit und . Statistische Unabhängigkeit bedeutet also nicht, dass es an Kausalität mangelt.L S1 S2
quelle
Anhand Ihrer Frage können Sie wie folgt denken:
In dieser Hinsicht glaube ich, dass Unabhängigkeit einen Mangel an Kausalität bedeutet. Abhängigkeit bedeutet jedoch nicht notwendigerweise Kausalität.
quelle