Bedingte mittlere Unabhängigkeit impliziert Unvoreingenommenheit und Konsistenz des OLS-Schätzers

10

Betrachten Sie das folgende multiple Regressionsmodell:

(1)Y=Xβ+Zδ+U.

Hier ist Y ein n×1 Spaltenvektor; X a n×(k+1) Matrix; β a (k+1)×1 Spaltenvektor; Z a n×l Matrix; δ a l×1 Spaltenvektor; und U , der Fehlerterm, ein n×1 Spaltenvektor.


FRAGE

Mein Dozent, das Lehrbuch Einführung in die Ökonometrie, 3. Aufl. von James H. Stock und Mark W. Watson, p. 281 und Ökonometrie: Honor's Exam Review Session (PDF) , p. 7, hat mir folgendes ausgedrückt.

  1. Wenn wir annehmen, was als bedingte mittlere Unabhängigkeit bezeichnet wird , was per Definition bedeutet, dass
    (2)E(U|X,Z)=E(U|Z),
  2. und wenn die Annahme der kleinsten Quadrate mit Ausnahme der bedingten mittleren Nullannahme E(U|X,Z)=0 erfüllt ist (also nehmen wir E(U|X,Z)=E(U|Z)0 ) (siehe 1- 3 unten),

  3. Dann wird der OLS Schätzer β von β in ( 1 ) bleibt unvoreingenommene und konsistente, im Rahmen dieser schwächeren Reihe von Annahmen.β^β(1)

Wie beweise ich diesen Vorschlag? Das heißt, dass 1 und 2 oben implizieren, dass die OLS-Schätzung von β uns einen unvoreingenommenen und konsistenten Schätzer für β liefert ? Gibt es einen Forschungsartikel, der diesen Vorschlag belegt?


KOMMENTAR

Der einfachste Fall ergibt sich aus der Betrachtung des linearen Regressionsmodells

Yi=β0+β1Xi+β2Zi+ui,i=1,2,,n,
und beweisendass die OLS schätzen β 1 von & bgr; 1 istwenn unvoreingenommene E ( u i | X i , Z i ) = E ( u i | Z i ) für jedes i .β^1β1E(ui|Xi,Zi)=E(ui|Zi)i

Beweis der Unbeschwertheit unter der Annahme, dass Ui und Zi GEMEINSAM NORMAL VERTEILT SIND

Definiere V=UE(U|X,Z) , dann U=V+E(U|X,Z) und

(*)E(V|X,Z)=0.
So (1) kann umgeschrieben werden als
(3)Y=Xβ+Zδ+E(U|X,Z)+V.
Durch(2)folgt danndass
(4)Y=Xβ+Zδ+E(U|Z)+V.
Da nunUiundZigemeinsam normalverteilt sind, ist die Theorie der Normalverteilungen vgl. Die Ableitung der bedingten Verteilungen einer multivariaten Normalverteilungbesagt, dass (tatsächlich müssen wir keine gemeinsame Normalität annehmen, sondern nur diese Identität)
(**)E(U|Z)=Zγ
für einigelmal1Vektorγ0.

Jetzt (4) wird

(5)Y=Xβ+Z(δ+γ)+V.
Für das Modell (5) alle Annahmen der kleinsten Quadrate erfüllt, da der Fehlerterm V die Annahme des bedingten Mittelwerts Null erfüllt. Dies bedeutet , dass die OLS Schätzung β von β unvoreingenommen sein wird, denn wenn wir lassen ρ = δ + γ und lassen W = ( X , Z ) kann dieβ^βρ=δ+γW=(X,Z)n von(k+1)+l Matrix ausX undZ , dann schätzen die OLS vonβ in(5) ist gegeben durch die folgende Berücksichtigung ( β T , ρ T ) T
(β^T,ρ^T)T=(WTW)1WTY=(WTW)1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)1WTV

und somit

E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)1WsTE(V|W)=(βT,ρT)T+(WTW)1WT0=(βT,ρT)T,
wobei die zweite Zeile durch()folgt. Somit β ist eine bedingt unvoreingenommene Abschätzung desβda die OLS fürModell gegeben Schätzung(1)coinicides mit derjenigen fürModell gegeben(5). Nun, durch das Gesetz der Gesamt Erwartung E ( β )β^β(1)(5)
E(β^)=E(E(β^|W))=E(β)=β,
und somit β ist ein unverzerrter Schätzer fürβ.β^β

(Man kann bemerken , daß E(ρ^)=ρ=δ+γδ , so daß der Koeffizient auf Z ist nicht notwendigerweise unvoreingenommene.)

Der obige Sonderfall geht jedoch davon aus, dass Ui und Zi gemeinsam normalverteilt sind. Wie beweise ich den Satz ohne diese Annahme?

Angenommen, E(U|Z)=Zγ reicht natürlich immer aus (vgl. () ), aber ich soll das Ergebnis nur unter Verwendung von (2) und der Annahme der kleinsten Quadrate ohne die Annahme des bedingten mittleren Nullpunkts ableiten (siehe unten).

IN BEZUG AUF KONSISTENZ

β^β(5)V()

()(2)

SUBQUERY 1

()

DIE MINDESTQUADRATISCHEN ANNAHMEN

E(U|X,Z)=0E(U|X,Z)0ZU

Die Annahme der kleinsten Quadrate ist die folgende.

  1. (Yi,Xi,Zi)i=1,2,,n,YiiYXiZiiXZ

  2. iXi,ZiUiUiiU

  3. (X,Z)WTW

  4. Var(Ui|Xi,Zi)=σU2iUi(Xi,Zi)i

HINWEIS ZUR TERMINOLOGIE

(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)

Diese Terminologie wird zB in Introduction to Econometrics, 3. Aufl. von James H. Stock und Mark W. Watson, p. 281; und ökonometrische Analyse von Querschnitts- und Paneldaten, 1. Aufl. von Jeffrey M. Wooldridge, p. 607. Siehe auch Bedingte Unabhängigkeitsbeschränkungen: Testen und Schätzen für ähnliche Diskussionen.

ZUSÄTZLICHE GEDANKEN UND SUBQUERY 2

βE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γββ(4)E(U|Z)

Eine zusätzliche Frage ist daher, ob es ein Gegenbeispiel zu der These gibt, dass die bedingte mittlere Unabhängigkeit zu einer unvoreingenommenen OLS-Schätzung führt.

SUBQUERY 3

YXWXYXYXWX(1) ist weniger voreingenommen als wenn CI nicht gilt (alle anderen gleich).

Kann diese Idee irgendwie verwendet werden, um meine Hauptfrage hier zu beantworten?

Elias
quelle
Yi=β0+β1Xi+β2Zi+uiE(ui|Xi,Zi)=E(ui|Zi)
Elias
@ Xi'an Wie würden Sie in diesem Fall "bedingte Unabhängigkeit $ ce" definieren? Aus meiner Sicht ist "bedingte Unabhängigkeit" ein Konzept, das sich von "bedingter mittlerer Unabhängigkeit" unterscheidet. Sie können konzeptionell verknüpft sein oder nicht.
Elias
P(AB|C)=P(A|C)P(B|C)E(A|B,C)=E(A|C)
Wo ist Xi'ans Kommentar?
Michael R. Chernick
E(U|X,Z)=E(U|Z)

Antworten:

4

ββE(u|x,z)=zγ

E(u|x,z)

E(u|z)=xα1+zα2+ν
βα1γα2xE(u|z)zα1

ξF(),ζG(),νH()all independentz=ξx=z2+ζu=z+z2E(z+z2)+ν

uE(u|x,z)=E(u|z)=z+z2E(z+z2)F,G,Hα1

Hier ist ein sehr einfaches Beispiel, Rdas den Punkt demonstriert:

set.seed(12344321)
z <- runif(n=100000,min=0,max=10)
x <- z^2 + runif(n=100000,min=0,max=20)
u <- z + z^2 - mean(z+z^2) + rnorm(n=100000,mean=0,sd=20)
y <- x + z + u

summary(lm(y~x+z))

# auxiliary regression
summary(lm(z+z^2~x+z))

xxz2E(u|z)

y=xβ+zγ+E(u|z)+v

zzxu

f()f(z)=zγ+E(u|z)

y=xβ+f(z)+v
β weil es kein ausgelassenes Variablenproblem mehr gibt.

zz=1

y=xβ+v
βf(1)z=2z=3. Dann hätten Sie eine Menge guter Schätzer, aus denen Sie einen großartigen Schätzer machen könnten, indem Sie sie beispielsweise alle irgendwie zusammen mitteln.

z=1zz

Rechnung
quelle
3

(4)

Y=Xβ+Zδ+(E(U|Z)+V)

MZ=IZ(ZZ)1ZMZZ=0

Durch "partitionierte Regressionsergebnisse" haben wir das

β^OLSβ=(XMZX)1XMZZδ+(XMZX)1XMZE(UZ)+(XMZX)1XMZV

Der erste Term rechts ist bereits Null. Wenn Sie den erwarteten Wert durchgehend nehmen und dann die Turmeigenschaft für die bedingte Erwartung anwenden, ist der dritte Term ebenfalls Null (unter Verwendung der bedingten mittleren Unabhängigkeit in ihrer schwächeren Form). Aber das ist so weit, dass diese schwächere Annahme uns führt, weil wir mit bleiben werden

E(β^OLS)β=E[(XMZX)1XMZE(UZ)]

E(UZ)ZMZZ
β

E(UX,Z)=E(UZ)=Zγ

UZ

β^OLS

Alecos Papadopoulos
quelle
MZMz
1
Zz