Es gibt einige Möglichkeiten, wie Sie den Gender-Dummy in einer Regression mit festen Effekten belassen können.
Innerhalb Estimator
Angenommen, ein ähnliches Modell haben im Vergleich zum Modell gepoolten OLS welches
,
wobei die Variablen wie zuvor. Man beachte nun, dass β 1 und β 1 + γ 1 ( m a l e i ) nicht identifiziert werden können, da der Schätzer innerhalb sie nicht von dem festen Effekt c i unterscheiden kann . Da β 1 der Achsenabschnitt für das Basisjahr t = 1 ist , ist γ 1 der geschlechtsspezifische Effekt auf das Einkommen in diesem Zeitraum. Was können wir in diesem Fall identifizieren sind γ 2 , . . .
yit=β1+∑t=210βtdt+γ1(malei)+∑t=110γt(dt⋅malei)+X′itθ+ci+ϵit
β1β1+γ1(malei)ciβ1t=1γ1 weil sie mit Ihren Zeitattrappen interagieren und die Unterschiede in den Teileffekten Ihrer geschlechtsspezifischen Variablen im Vergleich zum ersten Zeitraum messen. Dies bedeutetwenn Sie eine Erhöhung Ihrer beobachten
γ 2 , . . . , γ 10 im Zeitverlauf ist dies ein Hinweis auf eine Ausweitung des Verdienstgefälles zwischen Männern und Frauen.
γ2,...,γ10γ2,...,γ10
First-Difference Estimator
Wenn Sie die Gesamtwirkung der Unterschied zwischen Männern und Frauen im Laufe der Zeit erfahren möchten, können Sie das folgende Modell versuchen:
wobei die Variable t = 1 , 2 ist ,
yit=β1+∑t=210βtdt+γ(t⋅malei)+X′itθ+ci+ϵit
t=1,2,...,10 is interacted with the time-invariant gender dummy. Now if you take first differences
β1 and
ci drop out and you get
yit−yi(t−1)=∑t=310βt(dt−d(t−1))+γ(t⋅malei−[(t−1)malei])+(X′it−X′i(t−1))θ+ϵit−ϵi(t−1)
Then
γ(t⋅malei−[(t−1)malei])=γ[(t−(t−1))⋅malei]=γ(malei) and you can identify the gender difference in earnings
γ. So the final regression equation will be:
Δyit=∑t=310βtΔdt+γ(malei)+ΔX′itθ+Δϵit
and you get your effect of interest. The nice thing is that this is easily implemented in any statistical software but you lose a time period.
Hausman-Taylor Estimator
This estimator distinguishes between regressors that you can assume to be uncorrelated with the fixed effect ci and those that are potentially correlated with it. It further distinguishes between time-varying and time-invariant variables. Let 1 denote variables that are uncorrelated with ci and 2 those who are and let's say your gender variable is the only time-invariant variable. The Hausman-Taylor estimator then applies the random effects transformation:
y~it=X~′1it+X~′2it+γ(male˜i2)+c~i+ϵ~it
X~1it=X1it−θ^iX¯¯¯¯1i where
θ^i is used for the random effects transformation and
X¯¯¯¯1i2ciX~2it the instrument is
X2it−X¯¯¯¯2i. The same is done for the time-invariant variables, so if you specify the gender variable to be potentially correlated with the fixed effect it gets instrumented with
X¯¯¯¯1i, so you must have more time-varying than time-invariant variables.
All of this might sound a little complicated but there are canned packages for this estimator. For instance, in Stata the corresponding command is xthtaylor
. For further information on this method you could read Cameron and Trivedi (2009) "Microeconometrics Using Stata". Otherwise you can just stick with the two previous methods which are a bit easier.
Inference
For your hypothesis tests there is not much that needs to be considered other than what you would need to do anyway in a fixed effects regression. You need to take care for the autocorrelation in the errors, for example by clustering on the individual ID variable. This allows for an arbitrary correlation structure among clusters (individuals) which deals with autocorrelation. For a reference see again Cameron and Trivedi (2009).