Wie berechnet man das Vorhersageintervall für eine OLS-Mehrfachregression?

24

Wie lautet die algebraische Notation zur Berechnung des Vorhersageintervalls für die multiple Regression?

Es klingt albern, aber ich habe Probleme, eine klare algebraische Notation dafür zu finden.

Michael
quelle

Antworten:

31

Nehmen Sie ein Regressionsmodell mit Beobachtungen und Regressoren: Nk

y=Xβ+u

Unter der Annahme eines Vektors der vorhergesagte Wert für diese Beobachtung E [y \ vert \ mathbf {x_0}] = \ hat y_0 = \ mathbf {x_0} \ hat \ beta. Ein konsistenter Schätzer für die Varianz dieser Vorhersage ist \ hat V_p = s ^ 2 \ cdot \ mathbf {x_0} \ cdot (\ mathbf {X'X}) ^ {- 1} \ mathbf {x'_0}, wobei s ^ 2 = \ frac {\ Sigma_ {i = 1} ^ {N} \ hat u_i ^ 2} {Nk}. Der Vorhersagefehler für ein bestimmtes y_0 ist \ hat e = y_0- \ hat y_0 = \ mathbf {x_0} \ beta + u_0- \ hat y_0. Die Null-Kovarianz zwischen u_0 und \ hat \ beta impliziert, dass \ Var [\ hat e] = \ Var [\ hat y_0] + \ Var [u_0] ist, und ein konsistenter Schätzer dafür ist x0

E[y|x0]=y^0=x0β^.
V p = s 2 x 0( X ' X ) - 1 x ' 0 , s 2 = Σ N i = 1 u 2 i
V^p=s2x0(XX)1x0,
s2=Σi=1Nu^i2Nk.
y0 e =y0-
e^=y0y^0=x0β+u0y^0.
u0β^
Var[e^]=Var[y^0]+Var[u0],
V^f=s2x0(XX)1x0+s2.

Das 1α confidence ist:

y0±t1α/2V^p.
Das 1α prediction ist breiter:
y0±t1α/2V^f.

Dimitriy V. Masterov
quelle
Die obige Antwort ist sehr gut gemacht, aber ich denke, diese Quelle bietet einen Kontext für die Frage.
June Skeeter
@Dimitriy Ich glaube, deine zweite Gleichung sollte eine Karotte / einen Hut haben, '^', über der . β
Don Slowik
Ist der Prognosefehler nicht der Rest: ? e^=u^
Don Slowik