Unterschied zwischen Dummies mit festen Effekten und Schätzer für feste Effekte?

7

Ich begann über Panel-Regressionsmodelle zu lesen. Ich bin jedoch etwas verwirrt über die unterschiedlichen Modellspezifikationen im Modell mit festen Effekten:

Bedeutet eine Regression des Panels mit festen Effekten immer, dass ich Dummy-Variablen für die Querschnitte einführe (z. B. für jedes Land in meiner Stichprobe) und dann z. B. eine OLS-Schätzung durchführe?

Was ist der Unterschied zwischen dem Hinzufügen von Dummies mit festen Effekten zum Regressionsmodell und dem Schätzer für feste Effekte?

Danke für Ihre Hilfe!

Jeffrey
quelle

Antworten:

11

Um die Gleichheit zu sehen, leiten wir zuerst den FE-Schätzer ab.

Definieren Sie die Residual-Maker-Matrix

Q(M×M):=IM1M(1M1M)11M=IM(1/M1/M1/M1/M),
wobei M die Zahl bezeichnet Anzahl der Beobachtungen pro einzelne Einheit im Panel.

Die Vormultiplikation mit zentriert die und um ihre Durchschnittswerte über , impliziert auch, dass sich jedes Mal eine invariante Variable aus der Menge der Regressoren in eine Spalte mit Nullen verwandelt und daher aus den Daten entfernt wird.QyiZim

Qyi=yi1M1Myi/M=yi1Myi¯.
Zi

Dies ist ein schwerwiegender Nachteil des FE-Schätzers. Betrachten Sie das Beispiel von Lohnrückgängen für eine Gruppe von Mitarbeitern. Variablen wie Geschlecht oder Schulbildung sind von primärem Interesse, ändern sich jedoch (normalerweise) nicht mehr (im Laufe der Zeit).

Als haben wir das unter Verwendung des Fehlerkomponentenmodells , wobei den Vektor von idiosynkratischen zeitvariablen Fehlern bezeichnet, where ist die -Matrix der Beobachtungen an den zeitvarianten Regressoren. Das Stapeln der Beobachtungen über die Einheiten ergibt Q1M=0yi=Ziδ+1Mαi+ηiηiM

Qyi=QFiβ+Qηii=1,,ny~iF~iβ+η~i,
Fi(M×Lb)n
y~(Mn×1):=(y~1y~n)F~(Mn×Lb):=(F~1F~n)

Der FE-Schätzer wird einfach OLS auf diese Beobachtungen angewendet : Mn

β^FE=(F~F~)1F~y~

Um die Gleichheit zwischen FE- und Dummy-Variablen der kleinsten Quadrate zu sehen, stapeln Sie die Beobachtungen etwas weiter: und

y(Mn×1):=(y1yn)F(Mn×Lb):=(F1Fn)
η(Mn×1):=(η1ηn)α(n×1):=(α1αn).

Weiter sei

D(Mn×n):=In1M=(1MOO1M)

Dann wird das lineare Paneldatenmodell unter einer Fehlerkomponentenannahme in der Matrixnotation als ein Dummy-Variablenmodell.

y=Dα+Fβ+η,

Das heißt, wir können auch einen Schätzer für aus einer OLS-Regression auf die Regressoren und einzelnen spezifischen Effekten erhalten.βn

Beachten Sie nun, dass der Frisch-Waugh-Lovell-Satz besagt, dass der OLS-Schätzer von durch Regression von auf , wobei Verwendung von Symmetrie und Idempotenz von ergibt βMDyMDF

MD(Mn×Mn):=ID(DD)1D
MD
β^LSDV=(FMDF)1FMDy

Jetzt,

MD=IMn(In1M)[(In1M)(In1M)]1(In1M)=InIM(In1M)[(In1M)(In1M)]1(In1M)=InIM(In1M)[In1M1M]1(In1M)=InIM(In1M)[InM]1(In1M)=InIM(In1M)[In1M](In1M)=InIM(In1M)[In1M1M]=InIMIn1M1M1M=In(IM1M1M1M)=InQ

Also so dass

MDF=(InQ)F=(QQ)F=F~,
β^LSDV=β^FE.
Christoph Hanck
quelle
7

Die Least Square Dummy-Variable (LSDV: Regress mit Gruppenattrappen) und der Within-Schätzer (auch als Fixed-Effect-Schätzer bekannt: Regress mit erniedrigten Variablen) sind genau gleich. Der Within-Schätzer ist nur ein Berechnungstrick zum Schätzen des festen Effekts. Wenn Sie den Within-Schätzer jedoch manuell berechnen möchten, müssen Sie darauf achten, die richtige Anzahl von Freiheitsgraden in Ihrer Regression zu entfernen, da Sie sonst die Standardfehler unterschätzen. Die meisten Statistikpakete führen diese Korrektur jedoch für Sie durch (z. B. xtreg, z. B. in Stata).

JB
quelle
0

Um die Antwort von @JB zu ergänzen: Ich glaube, die beiden Ansätze sind nur dann gleich (oder besser: führen zu den gleichen Ergebnissen), wenn Sie mit einem ausgewogenen Panel-Set arbeiten. Bei unausgeglichenen Paneldaten unterscheiden sich die Ergebnisse je nachdem, welchen der beiden Ansätze Sie verwenden. Zumindest war dies der Fall, als ich es in Stata versuchte. Bitte korrigieren Sie mich, wenn ich falsch liege.

Anton K.
quelle