Instrumentenvariablen und Ausschlussbeschränkungen aus Sicht der Mediation

8

Ich habe Probleme, die Ausschlussbeschränkung in instrumentellen Variablen zu verstehen.

Ich verstehe, dass der unvoreingenommene Behandlungseffekt , wobei das Ergebnis ist, die Behandlung ist und das Instrument ist. Mit anderen Worten, . YS.B.=C.Öv(Y.,Z.)C.Öv(S.,Z.)Y.S.Z.B.=ichT.T.Compliance-Rate

Wenn ich jedoch in einem Mediationsrahmen darüber nachdenke und die Ausschlussbeschränkung anwende, ist dies immer weniger sinnvoll.

In einem Mediationsrahmen ist ITT = der oder . Der unvoreingenommene Behandlungseffekt ist also:C.Öv(S.,Z.)C.Öv(Y.,S.)+C.Öv(Y.,Z.|S.)

(C.Öv(S.,Z.)C.Öv(Y.,S.)+C.Öv(Y.,Z.|S.))C.Öv(S.,Z.) , was sich reduziert auf:

C.Öv(Y.,S.)+C.Öv(Y.,Z.|S.)C.Öv(S.,Z.) ,

Die unvoreingenommene kausale Schätzung ist also die Wirkung der voreingenommenen Behandlung + die Wirkung des Instruments ( .cÖntrÖllichnGfÖrthetreeintmentcÖmplicheinncereinte

Mit der Ausschlussbeschränkung sollte es jedoch keine Wirkung des Instruments geben, sobald wir die Behandlung kontrollieren.

Ein Beispiel aus Gelmans Beispiel in der Sesamstraße. Erstens, um den unvoreingenommenen Behandlungseffekt über 2SLS zu erhalten:

fit.2s <- lm(regular ~ encour, data = df)
watched.hat <- fit.2s$fitted
fit.2b <- lm(postlet ~ watched.hat, data = df)
summary(fit.2b)

das gibt die Antwort, 7.934.

Und jetzt innerhalb eines SEM-Rahmens:

library(foreign)
library(lavaan)
mod  <-
'
regular ~ a*encour
postlet ~ b*regular + c*encour
ind := a*b
total := a*b + c
'
fit <- sem(mod, data = df)
summary(fit)

 Regressions:
               Estimate  Std.Err  Z-value  P(>|z|)
  regular ~                                           
encour     (a)    0.362    0.051    7.134    0.000

  postlet ~                                           
  regular    (b)   13.698    2.079    6.589    0.000
  encour     (c)   -2.089    1.802   -1.160    0.246


  Defined Parameters:
               Estimate  Std.Err  Z-value  P(>|z|)
  ind               4.965    1.026    4.840    0.000
  total             2.876    1.778    1.617    0.106

13,698 - 2,089 / 0,362 = 7,92

Der einzige Grund, warum der unvoreingenommene Behandlungseffekt nicht nur der voreingenommene Behandlungseffekt ist, ist, dass das Instrument bei der Kontrolle der Behandlung immer noch einen Effekt aufweist, der gemäß der Ausschlussbeschränkung nicht auftreten sollte.

Vermisse ich hier etwas?

Sam
quelle

Antworten:

1

Sie geben zu Recht an, dass unter den LATE-artigen IV-Annahmen mit einem kausalen Effekt des IV Z auf die Behandlung S, einem exogenen Instrument und ohne direkten Einfluss auf das Ergebnis Y Ihr Behandlungseffekt B von S auf Y als identifiziert wird

C.Öv(Y.,Z.)/.C.Öv(S.,Z.)=ichT.T./.C.ÖmplicheinnceR.einte

So klar,

ichT.T.=C.Öv(Y.,Z.) ,

und nicht , wie Sie fälschlicherweise . Dies ist auch intuitiv klar, denn wenn das Instrument in Bezug auf die Behandlung und das Ergebnis exogen ist, werden seine kausalen Auswirkungen identifiziert und (unter Linearität) einfach die Korrelation zwischen dem Instrument und dem Ergebnis.C.Öv(S.,Z.)C.Öv(Y.,S.)+C.Öv(Y.,Z.)

Sie scheinen ferner zu implizieren, dass IV und Y in einer Regression von Y in Bezug auf die Behandlung und die IV nicht miteinander zusammenhängen sollten. Dies ist nicht der Fall, wenn die Behandlung S tatsächlich endogen ist. Dann ist es ein Kollider, da er durch die IV und den nicht beobachteten Fehlerterm von Y verursacht wird. Die Konditionierung auf die Behandlung macht die IV und den Fehlerterm abhängig, und daher auch die IV und Y. Sie erhalten also eine Nicht-Null Regressionskoeffizient, auch wenn die Ausschlussbeschränkung gültig ist. Dies sollte sehr klar sein, wenn Sie den Kausaldiagramm zeichnen.

Wenn dies nicht der Fall wäre, könnten wir die Ausschlussbeschränkung tatsächlich testen, aber wir wissen natürlich, dass wir sie normalerweise nicht testen können! (Zumindest nicht so einfach).

Julian Schuessler
quelle
Ich fügte hinzu , bearbeitet zu klären, sondern aus einer Mediation Perspektive, die ITT ist (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z). Dies ist anhand von Gelmans Beispiel überprüfbar: coef (Zusammenfassung (lm (postlet ~ ermut, Daten = df))) ['ermutigen',] ['Schätzung'] = 2,88. Aus der SEM-Ausgabe ergibt sich (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z) = 2,88 (die Schätzung neben der Summe, die a * b ist + c)
Sam
Wie kann es dann auch wahr sein, dass Cov (Y, Z) / Cov (S, Z) = ITT / ComplianceRate? Ihre Gleichung für die ITT- und die IV-Formel kann nicht gleichzeitig wahr sein. Mit der Ausschlussbeschränkung ist Ihre Formel nicht wahr.
Julian Schuessler
1
Beachten Sie auch, dass "aus Sicht der Mediation" die ITT eine kausale Größe ist und daher in potenziellen Ergebnissen oder mit dem Do-Operator definiert werden muss, nicht als Funktion des PDF von Observable. So wird die ITT beispielsweise als E (Y | do (Z)) definiert. Siehe en.wikipedia.org/wiki/… .
Julian Schuessler
Weil Cov (Y, Z) in (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) zerlegt werden kann. Vielleicht fehlt mir hier etwas, aber das ist mein Punkt: Die Identifizierung der kausalen Auswirkungen hängt davon ab, dass die Ausschlussbeschränkung falsch ist, oder so scheint es.
Sam
Ich habe meine Antwort bearbeitet. Ich verstehe Ihre Verwirrung immer noch nicht ganz. Vielleicht ist es sehr aufschlussreich, Pearl, Judäa, zu lesen. "Lineare Modelle: Ein nützliches" Mikroskop "für die Ursachenanalyse." Die Werkzeuge dort sind extrem einfach und machen deutlich, wie einfach dieses Problem ist.
Julian Schuessler