Im Allgemeinen können Sie die Koeffizienten aus der Ausgabe einer Probit-Regression nicht interpretieren (zumindest nicht auf standardmäßige Weise). Sie müssen die Randeffekte der Regressoren interpretieren, dh wie stark sich die (bedingte) Wahrscheinlichkeit der Ergebnisvariablen ändert, wenn Sie den Wert eines Regressors ändern und alle anderen Regressoren bei bestimmten Werten konstant halten. Dies unterscheidet sich vom linearen Regressionsfall, in dem Sie die geschätzten Koeffizienten direkt interpretieren. Dies liegt daran, dass im Fall der linearen Regression die Regressionskoeffizienten die Randeffekte sind .
Bei der Probit-Regression ist ein zusätzlicher Berechnungsschritt erforderlich, um die Randeffekte zu erhalten, nachdem Sie die Probit-Regression angepasst haben.
Lineare und Probit-Regressionsmodelle
Probit Regression : Daran erinnert , dass in der Probitmodell, Sie modellieren die (bedingte) Wahrscheinlichkeit eines "erfolgreichen" Ergebnis, das heißt, ,
P [ Y i = 1 | X 1 i , ... , X K i ; β 0 , … , β K ] = Φ ( β 0 + K ∑ k = 1 β k X k i )
wobei ΦY.ich= 1
P [ Yich= 1 ≤ X1 i, … , XKich; β0, … , ΒK] = Φ ( β0+ ∑k = 1KβkXk i)
ist die kumulative Verteilungsfunktion der Standardnormalverteilung. Dies besagt im Grunde genommen, dass abhängig von den Regressoren die Wahrscheinlichkeit, dass die Ergebnisvariable Y i 1 ist, eine bestimmte Funktion einer linearen Kombination der Regressoren ist.Φ ( ⋅ )Y.ich
Lineare Regression : Vergleichen Sie dies mit dem linearen Regressionsmodell
der (bedingte) Mittelwert des Ergebnisses ist eine lineare Kombination von die Regressoren.
E ( Yich∣ X1 i, … , XKich; β0, … , ΒK) = β0+ ∑k = 1KβkXki
Randeffekte
Anders als im linearen Regressionsmodell haben Koeffizienten selten eine direkte Interpretation. Wir sind in der Regel an den Ceteris-Paribus- Effekten von Änderungen der Regressoren interessiert, die sich auf die Merkmale der Ergebnisvariablen auswirken. Dies ist die Vorstellung, dass marginale Effekte messen.
- Lineare Regression : Ich möchte nun wissen, um wie viel sich der Mittelwert der Ergebnisvariablen bewegt, wenn ich einen der Regressoren bewege
∂E ( Yich∣ X1 i, … , XKich; β0, … , ΒK)∂Xk i= βk
k
- Probit-Regression : Es ist jedoch leicht zu erkennen, dass dies bei der Probit-Regression nicht der Fall ist
∂P [ Yich= 1 ≤ X1 i, … , XKich; β0, … , ΒK]∂Xk i= βkϕ ( β0+ ∑k = 1KβkXk i)
ϕ ( ⋅ )
Wie können Sie diese Größe berechnen, und welche Möglichkeiten haben die anderen Regressoren, die diese Formel eingeben sollen? Zum Glück liefert Stata diese Berechnung nach einer Probit-Regression und liefert einige Standardwerte der Auswahl der anderen Regressoren (es gibt keine universelle Übereinstimmung über diese Standardwerte).
Diskrete Regressoren
Xk i{ 0 , 1 } ist ,
ΔXk iP [ Yich= 1 ≤ X1 i, … , XKich; β0, … , ΒK]= βkϕ ( β0+ ∑l = 1k - 1βlXl ich+ βk+ ∑l = k + 1KβlXl ich)- βkϕ ( β0+ ∑l = 1k - 1βlXl ich+ ∑l = k + 1KβlXl ich)
Berechnung von Randeffekten in Stata
Probit-Regression : Hier ist ein Beispiel für die Berechnung von Randeffekten nach einer Probit-Regression in Stata.
webuse union
probit union age grade not_smsa south##c.year
margins, dydx(*)
Hier ist die Ausgabe, die Sie vom margins
Befehl erhalten
. margins, dydx(*)
Average marginal effects Number of obs = 26200
Model VCE : OIM
Expression : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .003442 .000844 4.08 0.000 .0017878 .0050963
grade | .0077673 .0010639 7.30 0.000 .0056822 .0098525
not_smsa | -.0375788 .0058753 -6.40 0.000 -.0490941 -.0260634
1.south | -.1054928 .0050851 -20.75 0.000 -.1154594 -.0955261
year | -.0017906 .0009195 -1.95 0.051 -.0035928 .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.
Dies kann zum Beispiel so interpretiert werden, dass die Änderung der age
Variablen um eine Einheit die Wahrscheinlichkeit des Gewerkschaftsstatus um 0,003442 erhöht. In ähnlicher Weise verringert sich die Wahrscheinlichkeit eines Gewerkschaftsstatus um 0,1054928 , wenn man aus dem Süden kommt
Lineare Regression : Als letzte Überprüfung können wir bestätigen, dass die Randeffekte im linearen Regressionsmodell dieselben sind wie die Regressionskoeffizienten (mit einer kleinen Drehung). Ausführen der folgenden Regression und Berechnen der Randeffekte nach
sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)
gibt nur die Regressionskoeffizienten zurück. Beachten Sie die interessante Tatsache, dass Stata den Netto- Marginaleffekt eines Regressors berechnet, einschließlich des Effekts durch die quadratischen Terme, falls im Modell enthalten.
. margins, dydx(*)
Average marginal effects Number of obs = 74
Model VCE : OLS
Expression : Linear prediction, predict()
dy/dx w.r.t. : weight foreign
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0069641 .0006314 -11.03 0.000 -.0082016 -.0057266
foreign | -2.2035 1.059246 -2.08 0.038 -4.279585 -.1274157
------------------------------------------------------------------------------
Auch und einfacher kann der Koeffizient in einer Probit-Regression interpretiert werden als "eine um eine Einheit erhöhte Altersrate entspricht einerβa ge Erhöhung des Z-Scores für die Wahrscheinlichkeit, in einer Gewerkschaft zu sein "( siehe Link ).
Dann mach
Und Sie werden sehen, dass für obs 1 der angepasste Wert dem entsprichtβa ge ≤20+βGr a de ≤12+βc o n s .
normal()
Stecken Sie das in die Funktion, um die entsprechende Wahrscheinlichkeit zurückzugeben:Eine Erhöhung des Alters um eine Einheit entspricht daher aβa ge Erhöhung des Z-Scores der Wahrscheinlichkeit, in der Gewerkschaft zu sein.
quelle