Normalverteilte Fehler und der zentrale Grenzwertsatz

9

In Wooldridges Introductory Econometrics gibt es ein Zitat:

Das Argument, das die Normalverteilung für die Fehler rechtfertigt, lautet normalerweise ungefähr so: Da die Summe vieler verschiedener unbeobachteter Faktoren ist, die , können wir den zentralen Grenzwertsatz aufrufen, um zu schließen, dass u eine ungefähre Normalverteilung hat.uyu

Dieses Zitat bezieht sich auf eine der linearen Modellannahmen, nämlich:

uN(μ,σ2)

Dabei ist u der Fehlerterm im Populationsmodell.

Soweit ich weiß, besagt der zentrale Grenzwertsatz, dass die Verteilung von

Zi=(Yi¯μ)/(σ/n)

(wobei Yi¯ Durchschnittswerte von Zufallsstichproben sind, die aus einer Population mit dem Mittelwert μ und der Varianz σ2 )

nähert sich der einer normalen Standardvariablen als n .

Frage:

Hilf mir zu verstehen, wie die asymptotische Normalität von Z_i u \ sim N (μ, σ ^ 2)Zi impliziert.uN(μ,σ2)

Gans
quelle

Antworten:

13

Dies kann besser gewürdigt werden, indem das Ergebnis der CLT in Summen von iid-Zufallsvariablen ausgedrückt wird. Wir haben

nX¯μσN(0,1)asymptotically

Multiplizieren Sie den Quotienten mit und verwenden Sie die Tatsache, dass , um zu erhaltenσnVar(cX)=c2Var(X)

X¯μN(0,σ2n)

Fügen Sie nun zur LHS hinzu und verwenden Sie die Tatsache, dass , um zu erhaltenμE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

Zuletzt multiplizieren Sie mit und verwenden Sie die beiden obigen Ergebnisse, um dies zu sehenn

i=1nXiN(nμ,nσ2)

Und was hat das mit Wooldridges Aussage zu tun? Nun, wenn der Fehler die Summe vieler iid-Zufallsvariablen ist , wird er, wie gerade gesehen, ungefähr normal verteilt sein. Hier gibt es jedoch ein Problem, nämlich dass die nicht beobachteten Faktoren nicht unbedingt identisch verteilt sind und möglicherweise nicht einmal unabhängig sind!

Trotzdem wurde die CLT unter einigen zusätzlichen Regelmäßigkeitsbedingungen erfolgreich auf unabhängige, nicht identisch verteilte Zufallsvariablen und sogar Fälle leichter Abhängigkeit erweitert. Dies sind im Wesentlichen Bedingungen, die garantieren, dass kein Begriff in der Summe einen unverhältnismäßigen Einfluss auf die asymptotische Verteilung ausübt, siehe auch die Wikipedia-Seite im CLT . Sie müssen diese Ergebnisse natürlich nicht kennen; Wooldridges Ziel ist es lediglich, Intuition zu vermitteln.

Hoffe das hilft.

JohnK
quelle
Ich würde hinzufügen (da der Autor Ökonometrie studiert), dass in seinem Fachgebiet viele Zufallsvariablen (zumindest die für die Modellierung verwendeten) keine ersten Momente wie die Cauchy-Verteilung definiert haben. Daher können Sie sich in diesem Bereich nicht auf CLT verlassen.
Deutsch Demidov