Betrachten Sie das folgende multiple Regressionsmodell: Y=Xβ+Zδ+U.(1)
Hier ist Y ein n×1 Spaltenvektor; X a n×(k+1) Matrix; β a (k+1)×1 Spaltenvektor; Z a n×l Matrix; δ a l×1 Spaltenvektor; und U , der Fehlerterm, ein n×1 Spaltenvektor.
FRAGE
Mein Dozent, das Lehrbuch Einführung in die Ökonometrie, 3. Aufl.
von James H. Stock und Mark W. Watson, p. 281 und Ökonometrie: Honor's Exam Review Session (PDF) , p. 7, hat mir folgendes ausgedrückt.
- Wenn wir annehmen, was als bedingte mittlere Unabhängigkeit bezeichnet wird , was per Definition bedeutet, dass
E(U|X,Z)=E(U|Z),(2)
und wenn die Annahme der kleinsten Quadrate mit Ausnahme der bedingten mittleren Nullannahme E(U|X,Z)=0 erfüllt ist (also nehmen wir E(U|X,Z)=E(U|Z)≠0 ) (siehe 1- 3 unten),
Dann wird der OLS Schätzer β von β in ( 1 ) bleibt unvoreingenommene und konsistente, im Rahmen dieser schwächeren Reihe von Annahmen.β^β(1)
Wie beweise ich diesen Vorschlag? Das heißt, dass 1 und 2 oben implizieren, dass die OLS-Schätzung von β uns einen unvoreingenommenen und konsistenten Schätzer für β liefert ? Gibt es einen Forschungsartikel, der diesen Vorschlag belegt?
KOMMENTAR
Der einfachste Fall ergibt sich aus der Betrachtung des linearen Regressionsmodells Yi=β0+β1Xi+β2Zi+ui,i=1,2,…,n,
und beweisendass die OLS schätzen β 1 von & bgr; 1 istwenn unvoreingenommene E ( u i | X i , Z i ) = E ( u i | Z i ) für jedes i .β^1β1E(ui|Xi,Zi)=E(ui|Zi)i
Beweis der Unbeschwertheit unter der Annahme, dass Ui und Zi GEMEINSAM NORMAL VERTEILT SIND
Definiere V=U−E(U|X,Z) , dann U=V+E(U|X,Z) und E(V|X,Z)=0.(*)
So (1) kann umgeschrieben werden als Y=Xβ+Zδ+E(U|X,Z)+V.(3)
Durch(2)folgt danndassY=Xβ+Zδ+E(U|Z)+V.(4)
Da nunUiundZigemeinsam normalverteilt sind, ist die Theorie der Normalverteilungen vgl. Die Ableitung der bedingten Verteilungen einer multivariaten Normalverteilungbesagt, dass (tatsächlich müssen wir keine gemeinsame Normalität annehmen, sondern nur diese Identität)E(U|Z)=Zγ(**)
für einigelmal1Vektorγ≠0.
Jetzt (4) wird Y=Xβ+Z(δ+γ)+V.(5)
Für das Modell (5) alle Annahmen der kleinsten Quadrate erfüllt, da der Fehlerterm V die Annahme des bedingten Mittelwerts Null erfüllt. Dies bedeutet , dass die OLS Schätzung β von β unvoreingenommen sein wird, denn wenn wir lassen ρ = δ + γ und lassen W = ( X , Z ) kann dieβ^βρ=δ+γW=(X,Z)n von(k+1)+l Matrix ausX undZ , dann schätzen die OLS vonβ in(5) ist gegeben durch die folgende Berücksichtigung ( β T , ρ T ) T(β^T,ρ^T)T=(WTW)−1WTY=(WTW)−1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)−1WTV
und somit E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)−1WsTE(V|W)=(βT,ρT)T+(WTW)−1WT0=(βT,ρT)T,
wobei die zweite Zeile durch(∗)folgt. Somit β ist eine bedingt unvoreingenommene Abschätzung desβda die OLS fürModell gegeben Schätzung(1)coinicides mit derjenigen fürModell gegeben(5). Nun, durch das Gesetz der Gesamt Erwartung E ( β )β^β(1)(5)E(β^)=E(E(β^|W))=E(β)=β,
und somit β ist ein unverzerrter Schätzer fürβ.β^β
(Man kann bemerken , daß E(ρ^)=ρ=δ+γ≠δ , so daß der Koeffizient auf Z ist nicht notwendigerweise unvoreingenommene.)
Der obige Sonderfall geht jedoch davon aus, dass Ui und Zi gemeinsam normalverteilt sind. Wie beweise ich den Satz ohne diese Annahme?
Angenommen, E(U|Z)=Zγ reicht natürlich immer aus (vgl. (∗∗) ), aber ich soll das Ergebnis nur unter Verwendung von (2) und der Annahme der kleinsten Quadrate ohne die Annahme des bedingten mittleren Nullpunkts ableiten (siehe unten).
IN BEZUG AUF KONSISTENZ
β^β(5)V(∗)
(∗∗)(2)
SUBQUERY 1
(∗∗)
DIE MINDESTQUADRATISCHEN ANNAHMEN
E(U|X,Z)=0E(U|X,Z)≠0ZU
Die Annahme der kleinsten Quadrate ist die folgende.
(Yi,Xi,Zi)i=1,2,…,n,YiiYXiZiiXZ
iXi,ZiUiUiiU
(X,Z)WTW
Var(Ui|Xi,Zi)=σ2UiUi(Xi,Zi)i
HINWEIS ZUR TERMINOLOGIE
(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)
Diese Terminologie wird zB in Introduction to Econometrics, 3. Aufl. von James H. Stock und Mark W. Watson, p. 281; und ökonometrische Analyse von Querschnitts- und Paneldaten, 1. Aufl. von Jeffrey M. Wooldridge, p. 607. Siehe auch Bedingte Unabhängigkeitsbeschränkungen: Testen und Schätzen für ähnliche Diskussionen.
ZUSÄTZLICHE GEDANKEN UND SUBQUERY 2
βE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γββ(4)E(U|Z)
Eine zusätzliche Frage ist daher, ob es ein Gegenbeispiel zu der These gibt, dass die bedingte mittlere Unabhängigkeit zu einer unvoreingenommenen OLS-Schätzung führt.
SUBQUERY 3
YXWXYXYXWX(1) ist weniger voreingenommen als wenn CI nicht gilt (alle anderen gleich).
Kann diese Idee irgendwie verwendet werden, um meine Hauptfrage hier zu beantworten?
Antworten:
Hier ist ein sehr einfaches Beispiel,
R
das den Punkt demonstriert:quelle
Durch "partitionierte Regressionsergebnisse" haben wir das
Der erste Term rechts ist bereits Null. Wenn Sie den erwarteten Wert durchgehend nehmen und dann die Turmeigenschaft für die bedingte Erwartung anwenden, ist der dritte Term ebenfalls Null (unter Verwendung der bedingten mittleren Unabhängigkeit in ihrer schwächeren Form). Aber das ist so weit, dass diese schwächere Annahme uns führt, weil wir mit bleiben werden
quelle