Warum nicht die instrumentelle Variable direkt als Kovariate in der Regression verwenden?

8

Ich weiß, dass dies eine dumme Frage ist, da ich die Theorie der instrumentellen Variablen und der zweistufigen Regression kenne. Trotzdem habe ich nie eine klare Antwort auf Folgendes gesehen:

  • Angenommen, Sie haben eine Endogenität aufgrund einer nicht beobachteten Variablen, die mit einem der anfänglichen Regressoren korreliert. Der typische Weg, dies zu korrigieren, besteht darin, eine instrumentelle Variable zu finden, die mit dem unbeobachteten Effekt korreliert, und einen zweistufigen Regressionsansatz zu verwenden.

Meine Frage ist nun, warum diese Schwierigkeiten auftreten - warum würden Sie die instrumentelle Variable nicht einfach als Standardregressor in die anfängliche Schätzung einbeziehen?

Daniel
quelle

Antworten:

12

Der Punkt der instrumentellen Variablenregression besteht darin, eine unvoreingenommene Schätzung des kausalen Effekts der Exposition auf das Ergebnis bereitzustellen , wenn eine nicht gemessene - möglicherweise nicht messbare - Variable vorliegt, die die Beziehung zwischen und verwechselt . Hier ist eine DAG des einfachsten Umstands, unter dem man die Schätzung instrumenteller Variablen verwenden würde ( , und können Sätze von Variablen sein):X.ÖU.X.ÖX.U.Z.

Wenn eine Instrumentenvariable verursacht , keine andere Auswirkung auf als durch , gibt es keine vorherige Ursache für und und die Auswirkung von auf ist homogen, dann mit einer ausreichend großen Probe wobei eine unvoreingenommene Schätzung der kausalen Wirkung von auf liefern kann .Z.X.ÖX.Z.ÖX.ÖE.[Ö|X.^]]X = E [ X | Z ] X O.X.^=E.[X.|Z.]]X.Ö

Zusammenfassend ist Ihnen die Auswirkung von auf (es gibt keine außer durch ) und egal , also schließen Sie einfach in Ihre ein Das Modell liefert keine Schätzung der instrumentellen Variablen.Z.ÖX.E.[Ö|X.^]]E.[Ö|X.,Z.]]Z.

Abschließender Kommentar: Das "... in der anfänglichen Schätzung?" Wenn ich Ihre Frage abschließe, möchte ich Folgendes klarstellen: Eine erste Schätzung (also ist tatsächlich Teil dieser Schätzung), und eine verwendet als Prädiktor für die zweite Schätzung (ohne ).X.^Z. X ZX.^Z.

Alexis
quelle
3

Sie können und Menschen tun. Wie @Alexis jedoch betont, erhalten Sie keine vollständige Antwort.

Stell dir vor , du bist in der Wirkung eines endogenen Variable interessiert auf und ist ein Instrument für . Bei IV in Ökonometrie:X.Y.Z.X.

  • Die Regression von auf wird als Regression der ersten Stufe bezeichnet .X.Z.
  • Die Regression von auf wird als Regression in reduzierter Form bezeichnet .Y.Z.

Die reduzierte Formregression allein schätzt die Wirkung von auf .X.Y.

Matthew Gunn
quelle