Kausale Wirkung durch Einstellungen der Hintertür und der Vordertür

12

Wenn wir den kausalen Effekt von auf im folgenden berechnen wollten , können wir sowohl den Satz für die Anpassung der Hintertür als auch für die Anpassung der Vordertür verwenden, dh XY

P(y|do(X=x))=uP(y|x,u)P(u)

und

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

Ist es eine einfache Hausaufgabe zu zeigen, dass die beiden Anpassungen zu demselben kausalen Effekt von auf ?XY

Graph

Jae
quelle
Ist das eine echte Hausaufgabe? Dann fügen Sie bitte das Selbststudien-Tag hinzu. Dann können die Leute Ihnen Hinweise geben und das Denken (und Lernen) Ihnen überlassen. Sagen Sie uns, was Sie versucht haben und wo Sie stecken. Denken Sie daran, Lebenslauf ist nicht für das Auslagern von Hausaufgaben ...
Knarpie
4
Hallo Knarpie, es ist ein Teil des Selbststudiums und keine Hausaufgabe. Ich lese gerade "Causal Inference in Statistics" von Pearl et al. und verbringe ungefähr 1 Stunde damit, über die Frage nachzudenken, die ich oben gestellt habe, da es eine natürliche Frage ist, sie zu stellen, aber nicht die Gleichheit zeigen kann. Entweder fehlt mir hier etwas oder die beiden Ausdrücke sind nicht gleich.
Jae

Antworten:

12

Die Aktion entspricht einem Eingriff an variable X dass setzt es auf xdo(x)Xx . Wenn wir auf eingreifen , bedeutet dies, dass die Eltern von X seinen Wert nicht mehr beeinflussen, was dem Entfernen der Pfeile entspricht, die auf X zeigen. Lassen Sie uns diesen Eingriff auf einer neuen DAG darstellen.XXX

Geben Sie hier die Bildbeschreibung ein

Nennen wir die ursprüngliche Beobachtungsverteilung und die Verteilung nach der Intervention P . Unser Ziel ist es, P in P auszudrücken . Beachten Sie, dass wir in P das U X haben . Auch die prä- und postinterventionellen Wahrscheinlichkeiten teilen diese beiden Invarianzen: P ( U ) = P ( U ) und P ( Y | X , U ) = P ( Y |PPPPPUXP(U)=P(U) da wir bei unserer Intervention keinen Pfeil berührt haben, der diese Variablen eingibt. So:P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

Die Ableitung der Haustür ist etwas aufwendiger. Beachten Sie zunächst, dass zwischen und Z keine Verwechslung besteht.XZ

P(Z|do(X))=P(Z|X)

Auch die gleiche Logik für die Ableitung mit sehen wir , dass zur Steuerung der X für die Ableitung der Wirkung von genug ist , Z auf Y , das heißtP(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

Wo ich die Primzahl für die Bequemlichkeit der Notation für den nächsten Ausdruck verwende. Diese beiden Ausdrücke beziehen sich also bereits auf die Verteilung vor der Intervention, und wir haben einfach die vorherige Backdoor-Begründung verwendet, um sie abzuleiten.

Das letzte Stück, das wir brauchen, ist, auf die Wirkung von auf Y zu schließen und die Wirkung von Z auf Y und X auf Z zu kombinieren . Um das zu tun, bemerkt in unserem Diagramm P ( Y | Z , d o ( X ) ) = P ( Y | d o ( Z ) , d o ( X ) ) = P ( Y | d o ( Z ) )XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z)), da die Wirkung von auf Y vollständig durch Z vermittelt wird und der Backdoor-Pfad von Z nach Y blockiert wird, wenn auf X eingegriffen wird . Daher:XYZZYX

P(Y|do(X))=ZP(Y|Z,do(X))P(Z|do(X))=ZP(Y|do(Z))P(Z|do(X))=ZXP(Y|X,Z)P(X)P(Z|X)=ZP(Z|X)XP(Y|X,Z)P(X)

Wo kann auf die folgende Art und Weise zu verstehen: wenn ich intervenieren Z , dann ist die Verteilung von Y ändert sich auf P ( Y | d o ( Z ) ) ; aber ich interveniere tatsächlich auf X, also möchte ich wissen, wie oft Z einen bestimmten Wert annehmen würde , wenn ich X ändere , was P istZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZX .P(Z|do(X))

Daher ergeben die beiden Anpassungen die gleiche postinterventionelle Verteilung in diesem Diagramm, wie wir gezeigt haben.


Wenn Sie Ihre Frage noch einmal lesen, ist mir der Gedanke gekommen, dass Sie möglicherweise direkt zeigen möchten, dass die rechte Seite der beiden Gleichungen in der präinterventionellen Verteilung gleich ist (was sie angesichts unserer vorherigen Ableitung sein müssen). Das ist auch nicht schwer direkt zu zeigen. Es genügt zu zeigen, dass in Ihrer DAG:

XP(Y|Z,X)P(X)=UP(Y|Z,U)P(U)

Beachten Sie, dass die DAG impliziert U , Z und U Z | X dann:YX|U,ZUZ|X

XP(Y|Z,X)P(X)=X(UP(Y|Z,X,U)P(U|Z,X))P(X)=X(UP(Y|Z,U)P(U|X))P(X)=UP(Y|Z,U)XP(U|X)P(X)=UP(Y|Z,U)P(U)

Hence:

ZP(Z|X)XP(Y|X,Z)P(X)=ZP(Z|X)UP(Y|Z,U)P(U)=UP(U)ZP(Y|Z,U)P(Z|X)=UP(U)ZP(Y|Z,X,U)P(Z|X,U)=UP(Y|X,U)P(U)
Carlos Cinelli
quelle
1
This is a very good and exhaustive answer. The bit where you identify the causal effect through the front-door is, however, superfluous (OP has already done it and it follows straight from the front-door theorem), and it also contains a mistake: There is no "law of total probability" for causal effects. That is, P(Y|do(X)) does not generally equal ZP(Y|do(Z))P(Z|do(X), but rather ZP(Y|Z,do(X))P(Z|do(X)), which is clearly different. See the big Pearl book on pages 87--88.
Julian Schuessler
@JulianSchuessler that’s why I wrote “can be thought as”, as a way to help understanding, but not literally saying it is. Regarding the front door derivation it wasn’t clear the OP knew how to obtain it, that’s why I put it there.
Carlos Cinelli
Great answer. Thanks, Carlos. The second part of your answer was exactly what I asked for. I have two follow-up questions here. 1) What search strategy did you use for algebraically manipulating the expressions in your second answer? (By squinting long enough at the expressions?) Since the search space is large, I am wondering how an algorithm can be written to be able to automatically come to the same conclusion.
Jae
2) I was also confused with how to interpret zP(Y|do(Z)P(Z|do(X)), as my first intuition was like Julian's suggestion. But the Pearl et al.'s book I mentioned uses your expression. I am wondering, whether, in general, when factoring a directed chain where the start node is the cause and end node is the effect, each factor has to be conditioned on do(Z) and not on Z, where Z is an intermediate note in the chain.
Jae
1
@Jeevaka this is an assumption encoded in the DAG, implied by its factorization and the assumption that the system is composed of modular, autonomous pieces. Thus, changes in P(X,U) do not affect P(Y|X,U). One way to help thinking about this is to write down the structural equations of both models M (observational model) and M (interventional model) and then derive the implied distributions P and P. You will see that the conditional of Y given X and U will be the same in both.
Carlos Cinelli