In der angewandten Wirtschaft und Statistik werden instrumentelle Variablen immer häufiger. Können wir für die Uneingeweihten einige nichttechnische Antworten auf die folgenden Fragen haben:
- Was ist eine Instrumentalvariable?
- Wann würde man eine instrumentelle Variable einsetzen wollen?
- Wie findet oder wählt man eine Instrumentalvariable?
regression
econometrics
instrumental-variables
Graham Cookson
quelle
quelle
Antworten:
[Das Folgende scheint aufgrund der Verwendung von Gleichungen vielleicht ein wenig technisch zu sein, baut jedoch hauptsächlich auf den Pfeiltabellen auf, um die Intuition zu vermitteln, die nur ein sehr grundlegendes Verständnis von OLS erfordert - lassen Sie sich also nicht zurückweisen.]
Angenommen, Sie möchten den kausalen Effekt von auf y i schätzen, der durch den geschätzten Koeffizienten für β gegeben ist , aber aus irgendeinem Grund besteht eine Korrelation zwischen Ihrer erklärenden Variablen und dem Fehlerterm:xi yi β
Dies könnte geschehen sein, weil wir vergessen haben, eine wichtige Variable aufzunehmen, die auch mit korreliert . Dieses Problem wird als weggelassen Variable Bias bekannt und dann β werden Sie nicht den kausalen Effekt geben (siehe hier für die Details). Dies ist der Fall, wenn Sie ein Instrument verwenden möchten, weil Sie nur dann den wahren kausalen Effekt finden können.xi βˆ
Ein Instrument ist eine neue Variable die nicht mit ϵ i korreliert, die aber gut mit x i korreliert und die nur y i bis x i beeinflusst - unser Instrument heißt also "exogen". Es ist wie in dieser Tabelle hier:zi ϵi xi yi xi
Wie verwenden wir diese neue Variable?xi
Vielleicht erinnern Sie sich an die Idee eines ANOVA-Typs hinter der Regression, bei der Sie die Gesamtvariation einer abhängigen Variablen in eine erklärte und eine unerklärte Komponente aufteilen. Wenn Sie zum Beispiel Ihr auf dem Instrument zurückführen ,
dann wissen Sie, dass die hier erläuterte Variation unserer ursprünglichen Gleichung exogen ist, da sie nur von der exogenen Variablen abhängt . In diesem Sinne teilen wir unser x i in einen Teil auf, von dem wir behaupten können, dass er mit Sicherheit exogen ist (das ist der Teil, der von z i abhängt ), und einen unerklärten Teil η i , der alle schlechten Variationen beibehält, die mit ϵ i korrelieren . Nun nehmen wir den exogenen Teil dieser Regression, nennen es ^ x i ,zi xi zi ηi ϵi xiˆ
Thanks to this slight diversion of our road to the causal effect we were able to consistently estimateβ by using the instrument. The cost of this diversion is that instrumental variables models are generally less precise, meaning that they tend to have larger standard errors.
How do we find instruments?zi would not be correlated with ϵi - this cannot be tested formally because the true error is unobserved. The main challenge is therefore to come up with something that can be plausibly seen as exogenous such as natural disasters, policy changes, or sometimes you can even run a randomized experiment. The other answers had some very good examples for this so I won't repeat this part.
That's not an easy question because you need to make a good case as to why your
quelle
As a medical statistician with no previous knowledge of econom(etr)ics, I struggled to get to grips with instrumental variables as I often struggled to follow their examples and didn't understand their rather different terminology (e.g. 'endogeneity', 'reduced form', 'structural equation', 'omitted variables'). Here's a few references I found useful (the first should be freely available, but I'm afraid the others probably require a subscription):
Staiger D. Instrumental Variables. AcademyHealth Cyber Seminar in Health Services Research Methods, March 2002. http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm
Newhouse JP, McClellan M. Econometrics in Outcomes Research: The Use of Instrumental Variables. Annual Review of Public Health 1998;19:17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17
Greenland S. An introduction to instrumental variables for epidemiologists. International Journal of Epidemiology 2000;29:722-729. http://dx.doi.org/10.1093/ije/29.4.722
Zohoori N, Savitz DA. Econometric approaches to epidemiologic data: Relating endogeneity and unobserved heterogeneity to confounding. Annals of Epidemiology 1997;7:251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9
I'd also recommend chapter 4 of:
quelle
Here are some slides that I prepared for an econometrics course at UC Berkeley. I hope that you find them useful---I believe that they answer your questions and provide some examples.
There are also more advanced treatments on the course pages for PS 236 and PS 239 (graduate-level political science methods courses) at my website: http://gibbons.bio/teaching.html.
Charlie
quelle
Non-technical (usually that's all I'm good for anyway): There are times when not only does X cause Y, but Y causes X as well. An instrumental variable is a device that can "clean up" this messy, inconvenient relationship so that the best estimates can be made of X's effect on Y.
The instrumental variable is chosen by virtue of its relationships: it is a cause of X, but, other than acting through X, it has no effect on Y. The instrument (or instruments) is used in Stage One to compute a new "version" of X, one that is in no way a function of Y. This new "predicted" X is then used in a second stage, in a more standard regression, to explain/predict Y. Hence the term Two-Stage Least Squares regression.
One typically finds the IV in processes that are overriding or beyond the control of X OR Y, such as variables that depend on laws, policies, acts of nature, etc.
quelle