Konsistenz von 2SLS mit binärer endogener Variable

Ich habe gelesen, dass der 2SLS-Schätzer auch mit binären endogenen Variablen konsistent ist ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). In der ersten Stufe wird anstelle eines linearen Modells ein Probit-Behandlungsmodell ausgeführt.

Gibt es einen formalen Beweis dafür, dass 2SLS auch dann noch konsistent ist, wenn die 1. Stufe ein Probit- oder Logit-Modell ist?

Was ist auch, wenn das Ergebnis auch binär ist? Ich verstehe, wenn wir ein binäres Ergebnis und eine binäre endogene Variable haben (1. und 2. Stufe sind beide binäre Probit / Logit-Modelle), führt die Nachahmung der 2SLS-Methode zu einer inkonsistenten Schätzung. Gibt es dafür einen formellen Beweis? Wooldridges ökonometrisches Buch hat einige Diskussionen, aber ich denke, es gibt keinen strengen Beweis, um die Inkonsistenz zu zeigen.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

der Koeffizient von p = 1.19984. Ich führe nur eine Simulation durch, aber mit einer großen Stichprobengröße.

probit instrumental-variables endogeneity Vincent
quelle

Müssen Sie der model-Anweisung nicht link = probit hinzufügen ?

Mike Hunter

Es gab eine ähnliche Frage bezüglich einer Probit-ersten Stufe und einer OLS-zweiten Stufe. In der Antwort habe ich einen Link zu Notizen bereitgestellt, die einen formalen Beweis für die Inkonsistenz dieser Regression enthalten, die formal als "verbotene Regression" bekannt ist, wie sie von Jerry Hausman genannt wurde. Der Hauptgrund für die Inkonsistenz des Ansatzes Probit First Stage / OLS Second Stage besteht darin, dass weder der Erwartungsoperator noch der Operator für lineare Projektionen eine nichtlineare erste Stufe durchlaufen. Daher sind die angepassten Werte aus einem Probit der ersten Stufe nur unter sehr restriktiven Annahmen, die in der Praxis so gut wie nie gelten, nicht mit dem Fehlerterm der zweiten Stufe korreliert. Beachten Sie jedoch, dass der formale Beweis für die Inkonsistenz der verbotenen Regression ziemlich ausführlich ist, wenn ich mich richtig erinnere.

Wenn Sie ein Modell bei dem ein kontinuierliches Ergebnis und eine binäre endogene Variable ist, können Sie die erste Stufe über OLS und verwenden Sie in der zweiten Stufe die angepassten Werte anstelle von . Dies ist das lineare Wahrscheinlichkeitsmodell, auf das Sie sich bezogen haben. Da es für diese lineare erste Stufe kein Problem mit Erwartungen oder linearen Projektionen gibt, sind Ihre 2SLS-Schätzungen konsistent, wenn auch weniger effizient als sie sein könnten, wenn wir die nichtlineare Natur von berücksichtigen würden .

Y_{i} = α + β X_{i} + ϵ_{i}

$Y_i = \alpha + \beta X_i + \epsilon_i$

Y_{i}

$Y_i$

X_{i}

$X_i$

X_{i} = a + Z_{i}^{'} π + η_{i}

$X_i = a + Z'_i\pi + \eta_i$

{\hat{X}}_{i}

$\widehat{X}_i$

X_{i}

$X_i$

X_{i}

$X_i$

Die Konsistenz dieses Ansatzes beruht auf der Tatsache, dass ein nichtlineares Modell zwar besser zu den bedingten Erwartungsfunktionen für begrenzte abhängige Variablen passt, dies jedoch keine große Rolle spielt, wenn Sie an dem Randeffekt interessiert sind. Im linearen Wahrscheinlichkeitsmodell sind die Koeffizienten selbst Randeffekte, die am Mittelwert bewertet werden. Wenn also der Randeffekt am Mittelwert das ist, wonach Sie suchen (und normalerweise Menschen sind), dann ist dies das, was Sie wollen, da das lineare Modell die beste lineare ergibt Annäherungen an nichtlineare bedingte Erwartungsfunktionen.
Gleiches gilt, wenn binär ist. $Y_i$

Weitere Informationen hierzu finden Sie in den hervorragenden Vorlesungsunterlagen von Kit Baum zu diesem Thema. Ab Folie 7 diskutiert er die Verwendung des linearen Wahrscheinlichkeitsmodells im 2SLS-Kontext.

Wenn Sie Probit wirklich verwenden möchten, weil Sie effizientere Schätzungen wünschen, gibt es einen anderen Weg, der auch in Wooldridge (2010) "Ökonometrische Analyse von Querschnitts- und Paneldaten" erwähnt wird. Die oben verlinkte Antwort enthält sie, ich wiederhole sie hier der Vollständigkeit halber. Als angewandtes Beispiel siehe Adams et al. (2009) , die ein dreistufiges Verfahren anwenden, das wie folgt aussieht:

Verwenden Sie probit, um die endogene Variable auf dem Instrument (den Instrumenten) und die exogenen Variablen zu regressieren
Verwenden Sie die vorhergesagten Werte aus dem vorherigen Schritt in einer ersten OLS-Stufe zusammen mit den exogenen (aber ohne instrumentelle) Variablen
mache die zweite Stufe wie gewohnt

Dieses Verfahren fällt nicht auf das verbotene Regressionsproblem, sondern liefert möglicherweise effizientere Schätzungen Ihres interessierenden Parameters.

Andy
quelle

Hallo Andy, danke für deine Antwort. Schlagen Sie "Inkonsistenz des Probit First Stage / OLS Second Stage-Ansatzes" vor? Das habe ich nicht in dem Link gelesen, den ich gegeben habe. Probit First Stage / OLS Second Stage-Ansatz soll konsistent sein.

Vincent

Das sagt der statalistische Beitrag nicht. Wenn Sie sich den Abschnitt "Methoden und Formel" für den Befehl Treatreg (der jetzt als "etregress" bezeichnet wird) in der Dokumentation ansehen, werden Sie feststellen, dass der 2-Schritt-Schätzer nicht 2SLS mit einer Probit-ersten Stufe / OLS-zweiten Stufe ist. Stattdessen wird Probit zuerst verwendet, um die Gefährdungsquoten zu erhalten, die dann in einer OLS-Regression verwendet werden, um konsistente Schätzungen zu erhalten.

Andy

Danke, Andy. Es wird interessant. Es sieht so aus, als würde die Nachahmung von 2SLS mit dem Probit-Modell in der 1. Stufe nicht akzeptiert. Ich werde aus therapeutischen Gründen "Regression verbieten" durchlesen. Übrigens habe ich eine Simulation mit SAS versucht und die Ergebnisse sehen für 2SLS mit probit 1st / ols 2nd nicht schlecht aus.

Vincent

Ich poste den Code in der Hauptfrage und würde gerne Ihre Kommentare hören. Vielen Dank!

Vincent

Konsistenz von 2SLS mit binärer endogener Variable

Antworten: