Hintergrund
Angenommen, wir haben ein gewöhnliches Modell der kleinsten Quadrate, in dem wir Koeffizienten in unserem Regressionsmodell haben,
wobei ein Koeffizientenvektor ist, ist die Entwurfsmatrix durch definierte
Wir minimieren die Summe von eckigen Fehler , die durch unsere Schätzungen Einstellung für zu β = ( X T X ) - 1 X T
Ein unverzerrter Schätzer von IS s 2 = ‖ y - y ‖ 2 , wo y ≡X β (ref).
Die Kovarianz von β ist gegeben durch Cov ( β ) = σ 2 C , wo C ≡ ( X T X ) - 1 (
Frage
Wie kann ich beweisen , dass für β i , β i - β i wobeitn-keine t-Verteilung mit ist(n-k)Freiheitsgrade, und der Standardfehler von β iwird geschätzt durchs β i=s√
Meine Versuche
Ich weiß, dass man für Zufallsvariablen, die aus x ∼ N ( μ , σ 2 ) abgetastet wurden , zeigen kann, dass ˉ x - μ durch Umschreiben der LHS als ( ˉ x -μ
Ich konnte diesen Beweis nicht auf meine Frage übertragen ...
Irgendwelche Ideen? Ich bin mir dieser Frage bewusst , aber sie beweisen sie nicht explizit. Sie geben lediglich eine Faustregel an: "Jeder Prädiktor kostet Sie einen Freiheitsgrad."
Antworten:
Schon seit wir wissendass β -β~N(0,σ2(XTX)-1) und so erkennen wirdaß für jede Komponentekvon β , β k-βk≤N(0,σ2Skk)
Beachten Sie die Aussage des Satzes zur Verteilung einer idempotenten quadratischen Form in einem Standardnormalvektor (Satz B.8 in Greene):
Letε^ denote the regression residual vector and let
Let
We then need to do some linear algebra. Note these three linear algebra properties:
So
Then
Applying the Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector (stated above), we know thatV∼χ2n−p .
Since you assumed thatε is normally distributed, then β^ is independent of ε^ , and since s2 is a function of ε^ , then s2 is also independent of β^ . Thus, zk and V are independent of each other.
Then,
It can then be algebraically manipulated into a more familiar form.
quelle
Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector
, don't we also need