bedeutet (x) Operator?

14

Ich habe das gesehen Betreiber überall in einiger Literatur ich auf Kausalitäts tue (siehe zum Beispiel des Wikipedia - Eintrag ). Ich kann jedoch keine formale und allgemeine Definition dieses Operators finden.do(x)

Kann mir jemand einen guten Hinweis dazu geben? Ich interessiere mich eher für eine allgemeine Definition als für deren Interpretation in einem bestimmten Experiment.

Judio
quelle
1
Bezogen auf stats.stackexchange.com/questions/69806/…
Carlos Cinelli

Antworten:

11

Das ist Kalkül. Sie erklären es hier :do

Interventionen und counterfactuals werden durch einen mathematischen Operator genannt definiert , die durch das Löschen bestimmte Funktionen vom Modell physikalische Eingriffe simuliert, ersetzt sie mit einem konstanten X = x , während dem Rest des Modells unverändert. Das resultierende Modell wird mit M x bezeichnet .do(x)X=xMx

mbiron
quelle
13

Ein probabilistisches Structural verursachendes Modell (SCM) als Tupel definiert , wobei U eine Gruppe von exogenen Variablen ist, V eine Gruppe von endogenen Variablen, F eine Reihe von Strukturgleichungen die bestimmt , die Werte der einzelnen endogenen variable und P ( U ) eine Wahrscheinlichkeitsverteilung über den Bereich der U .M=U,V,F,P(U)UVFP(U)U

In einem SCM stellen wir die Wirkung einer Intervention auf eine Variable durch ein Submodell M x = U , V , F x , P ( U ) wobei F x zeigt an, dass die strukturelle Gleichung für X durch die neue interventionelle Gleichung ersetzt wird . Zum Beispiel kann die Atom Intervention der variable Einstellung X auf einen bestimmten Wert x bezeichnet --- normalerweise durch d o ( X = x ) --- besteht aus der Gleichung für den Ersatz XXMx=U,V,Fx,P(U)FxXXxdo(X=x)X mit der Gleichung .X=x

Stellen Sie sich zur Verdeutlichung ein nichtparametrisches strukturelles Kausalmodell das durch die folgenden Strukturgleichungen definiert wird:M

Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)

Wobei die Störungen eine Wahrscheinlichkeitsverteilung P ( U ) haben . Dies induziert eine Wahrscheinlichkeitsverteilung über die endogenen Variablen P M ( Y , Z , X ) und insbesondere eine bedingte Verteilung von Y bei X , P M ( Y |UP(U)PM(Y,Z,X)YX .PM(Y|X)

Beachten Sie jedoch , dass die "beobachtende" Verteilung von Y bei gegebenem X im Kontext von Modell M ist . Was würde sich auf die Verteilung von Y auswirken, wenn wir auf X eingreifen und es auf x setzen würden ? Dies ist nichts weiter als die Wahrscheinlichkeitsverteilung von Y, die durch das modifizierte Modell M x induziert wird :PM(Y|X)YXMYXxYMx

Z=UzX=xY=g(X,Z,Uy)

Das heißt, die interventionelle Wahrscheinlichkeit von , wenn wir setzen X = x wird durch die die Wahrscheinlichkeit induziert in submodel gegeben M x , das heißt, P M x ( Y | X = x ) , und es ist in der Regel gekennzeichnet durch P ( Y | d o ( X = x ) ) . Die d o ( X = x ) in einem Teilmodell , wo es eine Intervention Einstellung X zu entsprechen xYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x) Operator macht es klar , dass wir die Wahrscheinlichkeit , sind Rechen YXx, which corresponds to overriding the structural equation of X with the equation X=x.

The goal of many analyses is to find how to express the interventional distribution P(Y|do(X)) in terms of the joint probability of the observational (pre-intervention) distribution.

do-calculus

The do-calculus is not the same thing as the do() operator. The do-calculus consists of three inference rules to help "massage" the post-intervention probability distribution and get P(Y|do(X)) in terms of the observational (pre-intervention) distribution. Hence, instead of doing derivations by hand, such as in this question, you can let an algorithm perform the derivations and automatically give you a nonparametric expression for identifying your causal query of interest (and the do-calculus is complete for recursive nonparametric structural causal models).

Carlos Cinelli
quelle
I think you may be among the few on cross validated who might be interested in and able to answer this question: stats.stackexchange.com/q/444249/62396
joshphysics