Beweis des LETZTEN Theorems von Angrist und Imbens 1994

8

Angenommen, wir haben ein binäres Instrument dem die Auswirkung der endogenen Variablen auf das Ergebnis . Angenommen, das Instrument hat eine signifikante erste Stufe, es wird zufällig zugewiesen, es erfüllt die Ausschlussbeschränkung und es erfüllt die Monotonie, wie in Angrist und Imbens (1994) dargelegt. http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073ZiDiYi

Sie geben an, dass die Wahrscheinlichkeit, ein Complier ( ) zu sein, und der Unterschied in den möglichen Ergebnissen für die Subpopulation von Compliern ist Ci

Pr(Ci)=Pr(Di=1|Zi=1)Pr(Di=1Zi=0)
E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)

Kann jemand etwas Licht ins Dunkel bringen, wie sie diese beiden Ausdrücke bekommen und was noch wichtiger ist, wie sie sie kombinieren? Ich versuche dies aus ihrem Zeitschriftenartikel zu verstehen, aber ich kann es nicht verstehen. Jede Hilfe hierzu wäre sehr dankbar.

user44903
quelle

Antworten:

5

Im ersten Teil haben Sie angegeben, dass Sie ein „gültiges“ Instrument haben. Dies impliziert für eine binäre Behandlung und ein binäres Instrument, dass äquivalent zu P ( D i = 1 | Z i = 1 ) P ( D i = 1 | Z i = 0 ) ist.Cov(Di,Zi)0P(Di=1|Zi=1)P(Di=1|Zi=0)Das heißt, das Instrument hat einen Einfluss darauf, ob die Behandlung gewählt wird oder nicht. Diese Beobachtung, die auch im Papier von Angrist und Imbens erwähnt werden sollte, ist der Schlüssel für den Rest ihres Beweises. Für die erste Stufe nehmen sie an, dass , was bedeutet, dass die Anzahl der Complier ( C i ) größer ist als die der Defier ( F i ).P(Di=1|Zi=1)>P(Di=1|Zi=0)Ci)Fi

Mit der Ausschlussbeschränkung (für jedes { 0 ; 1 } gilt Y i z = Y i 0 z = Y i 1 z , dh das Instrument hat keinen direkten Einfluss auf das Ergebnis) können Sie den Unterschied in schreiben der Anteil der Komplizen und Trotzigen an der Bevölkerung als z0;1Yiz=Yi0z=Yi1z ZiP(Fi)=0P(Ci)=P(Di=1|Zi=1)-P(Di=1|Zi=0).

P(Di=1|Zi=1)P(Di=1|Zi=0)=P(Di1=1|Zi=1)P(Di0=1|Zi=0)=P(Di1=1)P(Di0=0)=[P(Di1=1,Di0=0)+P(Di1=1,Di0=1)][P(Di1=0,Di0=1)+P(Di1=1,Di0=1)]=P(Ci)P(Fi)
wobei der zweite Schritt die Unabhängigkeit verwendet, um die Konditionierung auf zu da potenzielle Ergebnisse unabhängig von der sind Instrument. Der dritte Schritt verwendet das Gesetz der Gesamtwahrscheinlichkeit. Im letzten Schritt müssen Sie dann nur die Monotonie verwenden, die grundsätzlich davon ausgeht, dass es keine Defier gibt, also ist und Sie erhalten ZiP(Fi)=0
P(Ci)=P(Di=1|Zi=1)P(Di=1|Zi=0).
Dies wäre Ihr Koeffizient der ersten Stufe in einer 2SLS-Regression. Die Annahme der Monotonie ist hierfür von entscheidender Bedeutung, und man sollte sich überlegen, warum sie möglicherweise verletzt wird (die Monotonie kann jedoch gelockert werden, siehe zum Beispiel de Chaisemartin (2012) „Alles, was Sie brauchen, ist SPÄT“ ).

Der zweite Teil des Beweises folgt einem ähnlichen Weg. Dazu müssen Sie bedenken, dass der beobachtete Behandlungsstatus da Sie nicht beide potenziellen Ergebnisse für dieselbe Person beobachten können. Auf diese Weise können Sie das beobachtete Ergebnis mit dem potenziellen Ergebnis, dem Behandlungsstatus und dem Instrument in als für den zweiten Teil des Beweises die Differenz des erwarteten Ergebnisses bei ein- und eingeschaltetem Instrument und verwenden Sie die vorherige Darstellung der beobachteten Ergebnisse und die Ausschlussbeschränkung in der erste Schritt zu bekommen:

Di=ZiDi1+(1Zi)Di0
Yi=(1Zi)(1Di)Yi00+Zi(1Di)Yi10+(1Zi)DiYi01+ZiDiYi11
E(Yi|Zi=1)E(Yi|Zi=0)=E(Yi1Di+Yi0(1Di)|Zi=0)E(Yi1Di+Yi0(1Di)|Zi=1)=E(Yi1Di1+Yi0(1Di1)|Zi=1)E(Yi1Di0+Yi0(1Di0)|Zi=0)=E(Yi1Di1+Yi0(1Di1))E(Yi1Di0+Yi0(1Di0))=E((Yi1Yi0)(Di1Di0))=E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)=E(Yi1Yi0|Ci)P(Ci)E(Yi1Yi0|Fi)P(Fi)=E(Yi1Yi0|Ci)P(Ci)

Das war ziemlich viel Arbeit, aber es ist nicht schlecht, wenn Sie die Schritte kennen, die Sie unternehmen müssen. Verwenden Sie für die zweite Zeile erneut die Ausschlussbeschränkung, um die möglichen Behandlungszustände aufzuschreiben. Verwenden Sie in der dritten Zeile die Unabhängigkeit, um die Konditionierung auf wie zuvor zu . In der vierten Zeile berücksichtigen Sie nur die Begriffe. Die fünfte Zeile verwendet das Gesetz der iterierten Erwartungen. Die letzte Zeile entsteht aufgrund der Monotonie-Annahme, dh . Dann müssen Sie nur noch als letzten Schritt teilen und gelangen zu ZiP(Fi)=0

E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Di=1|Zi=1)P(Di=1|Zi=0)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)
da und binär sind. Dies sollte zeigen, wie Sie die beiden Beweise kombinieren und wie sie zum endgültigen Ausdruck gelangen.DiZi
Andy
quelle
5

Es gibt vier Arten von Menschen:

  1. Never Takers (NT): für beide Werte von Z.D=0
  2. Defiers (DF): bei und beiD=0Z=1D=1Z=0
  3. Compliers (C): wenn und wennD=1Z=1D=0Z=0
  4. Immer Takers (AT): für beide Werte von .D=1Z

Die Formel für den Wald-Schätzer lautet:

ΔIV=E(Y|Z=1)E(Y|Z=0)Pr(D=1|Z=1)Pr(D=1|Z=0)

Unter Verwendung unserer 4 Gruppen und der Grundregeln der Wahrscheinlichkeit können wir die beiden Zählerstücke wie umschreiben: und

E(Y|Z=1)=E(Y1|AT)Pr(AT)+E(Y1|C)Pr(C)+E(Y0|DF)Pr(DF)+E(Y0|NT)Pr(NT)
E(Y|Z=0)=E(Y1|AT)Pr(AT)+E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)+E(Y0|NT)Pr(NT)

Die zwei Nennerterme sind: und

Pr(D=1|Z=1)=Pr(D=1|Z=1,AT)Pr(AT)+Pr(D=1|Z=1,C)Pr(C)=Pr(AT)+Pr(C)
Pr(D=1|Z=0)=Pr(D=1|Z=0,AT)Pr(AT)+Pr(D=1|Z=0,DF)Pr(DF)=Pr(AT)+Pr(DF)

Die erste davon entspricht Ihrem ersten Ausdruck.

Wenn wir zur Wald-Formel zurückkehren und diese , sehen wir, dass sich einige dieser Begriffe in der Subtraktion aufheben und Dies liefert einige Einblicke. Der Wald IV-Schätzer ist ein gewichteter Durchschnitt des Behandlungseffekts auf die Komplizen und des Negativen des Behandlungseffekts auf die Defier.

ΔIV=[E(Y1|C)Pr(C)+E(Y0|D)Pr(D)][E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)]Pr(C)Pr(DF).

Nun machen wir zwei Annahmen. Zunächst nehmen wir Monotonie an, so dass das Instrument die Wahrscheinlichkeit einer Teilnahme nur erhöhen oder verringern kann. Dies bedeutet, dass . Die Monotonie-Annahme entspricht der Annahme eines Indexfunktionsmodells für die Behandlung. Die zweite Annahme ist, dass es einige Komplizen gibt, das heißt, dass . Das Verhalten einiger Personen muss durch das Instrument geändert werden. Dies sollte der Fall sein, wenn das Instrument relevant ist. Diese beiden Annahmen ergebenPr(DF)=0Pr(C)>0

ΔIV=E(Y1|C)Pr(C)E(Y0|C)Pr(C)Pr(C)=E(Y1|C)E(Y0|C)=LATE.
Dimitriy V. Masterov
quelle
+1, ich denke, die beiden Antworten ergänzen sich sehr gut. Dieser zeigt mehr die Intuition des Wald-Schätzers und woher die Annahmen stammen, als sie nur auf rein technische Weise zu verwenden
Andy