Was Ihnen vorgeschlagen wurde, wird manchmal als verbotene Regression bezeichnet, und im Allgemeinen werden Sie das Interessenverhältnis nicht konsequent einschätzen. Verbotene Regressionen führen nur unter sehr restriktiven Annahmen zu konsistenten Schätzungen, die in der Praxis selten zutreffen (siehe beispielsweise Wooldridge (2010) "Ökonometrische Analyse von Querschnitts- und Paneldaten", S. 265-268).
Das Problem ist, dass weder der Operator für bedingte Erwartungen noch die lineare Projektion nichtlineare Funktionen ausführen. Aus diesem Grund wird garantiert, dass nur eine OLS-Regression in der ersten Stufe angepasste Werte erzeugt, die nicht mit den Residuen korreliert sind. Ein Beweis dafür ist in Greene (2008) "Econometric Analysis" zu finden. Wenn Sie einen detaillierteren (aber auch technischeren) Beweis wünschen, können Sie sich die Notizen von Jean-Louis Arcand auf S. 22 ansehen . 47 bis 52.
Aus dem gleichen Grund wie in der verbotenen Regression führt dieses scheinbar offensichtliche zweistufige Verfahren zur Nachahmung von 2SLS mit Probit nicht zu konsistenten Schätzungen. Dies liegt wiederum daran, dass Erwartungen und lineare Projektionen nicht durch nichtlineare Funktionen übertragen werden. Wooldridge (2010) in Abschnitt 15.7.3 auf Seite 594 bietet hierzu eine ausführliche Erklärung. Er erklärt auch das richtige Verfahren zur Schätzung von Probit-Modellen mit einer binären endogenen Variablen. Der richtige Ansatz besteht darin, die maximale Wahrscheinlichkeit zu verwenden, dies jedoch von Hand zu tun, ist nicht gerade trivial. Daher ist es vorzuziehen, wenn Sie Zugriff auf eine Statistiksoftware haben, die ein vorgefertigtes Paket dafür enthält. Der Befehl Stata wäre beispielsweise ivprobit
(siehe das Stata- Handbuch für diesen Befehl, in dem auch der Maximum-Likelihood-Ansatz erläutert wird).
Wenn Sie Referenzen für die Theorie hinter Probit mit instrumentellen Variablen benötigen, siehe zum Beispiel:
- Newey, W. (1987) "Effiziente Schätzung begrenzter abhängiger Variablenmodelle mit endogenen erklärenden Variablen", Journal of Econometrics, Vol. 36, S. 231-250
- Rivers, D. und Vuong, QH (1988) "Begrenzte Informationsschätzer und Exogenitätstests für simultane Probit-Modelle", Journal of Econometrics, Vol. 3, No. 39, S. 347-366
Schließlich ist es schwierig, verschiedene Schätzmethoden in der ersten und zweiten Stufe zu kombinieren, es sei denn, es gibt eine theoretische Grundlage, die ihre Verwendung rechtfertigt. Dies bedeutet jedoch nicht, dass dies nicht möglich ist. Zum Beispiel haben Adams et al. (2009) verwenden ein dreistufiges Verfahren, bei dem sie eine Probit- "erste Stufe" und eine OLS-zweite Stufe haben, ohne auf das verbotene Regressionsproblem hereinzufallen. Ihr allgemeiner Ansatz ist:
- Verwenden Sie probit, um die endogene Variable auf dem Instrument (den Instrumenten) und die exogenen Variablen zu regressieren
- Verwenden Sie die vorhergesagten Werte aus dem vorherigen Schritt in einer ersten OLS-Stufe zusammen mit den exogenen (aber ohne instrumentelle) Variablen
- mache die zweite Stufe wie gewohnt
Ein ähnliches Verfahren wurde von einem Benutzer des Statalisten angewendet, der eine erste Stufe von Tobit und eine zweite Stufe von Poisson verwenden wollte (siehe hier ). Die gleiche Lösung sollte für Ihr Schätzproblem möglich sein.
Dies scheint nicht der Fall zu sein. In der Arcand-Diskussion geht es nicht um die funktionale Form. Stattdessen geht es um die Einbeziehung verschiedener Kovariatensätze in die Modelle der ersten Stufe im Vergleich zu den Modellen der zweiten Stufe. "Mit anderen Worten, das korrekte 2SLS-Verfahren beinhaltet die Einbeziehung aller exogenen Kovariaten, die in der Strukturgleichung in der reduzierten Form der ersten Stufe erscheinen. Die verbotene Regression beinhaltet das Auslassen einiger oder aller von ihnen."
Um auf die ursprüngliche Frage zurückzukommen, würde ich empfehlen, für die erste Stufe einen OLS und für die zweite Stufe den Probit zu verwenden. Obwohl dies technisch voreingenommen sein mag, ist es wahrscheinlich (vorausgesetzt, Sie haben ein gutes Instrument) weniger voreingenommen als der Nicht-IV-Ansatz.
quelle