Ich möchte , verstehen , warum unter dem OLS - Modell, die RSS (Restsumme der Quadrate) verteilt wird ( die Anzahl der Parameter in dem Modell ist, die Anzahl der Beobachtungen).
Ich entschuldige mich dafür, dass ich eine so grundlegende Frage gestellt habe, aber ich kann die Antwort anscheinend nicht online (oder in meinen anwendungsorientierten Lehrbüchern) finden.
regression
distributions
least-squares
Tal Galili
quelle
quelle
Antworten:
Ich betrachte folgendes lineares Modell:y=Xβ+ϵ .
Der Vektor der Residuen wird geschätzt durch
wobei .Q=I−X(X′X)−1X′
Beachten Sie, dass (die Kurve ist bei zyklischer Permutation invariant) und dass Q ' = Q = Q 2 . Die Eigenwerte von Q sind daher 0 und 1 (einige Details unten). Daher existiert eine einheitliche Matrix V, so dass ( Matrizen sind genau dann durch einheitliche Matrizen diagonalisierbar, wenn sie normal sind. )tr(Q)=n−p Q′=Q=Q2 Q 0 1 V
Nun wollen wir ε .K=V′ϵ^
Da ε ~ N ( 0 , & sgr; 2 Q ) , haben wir K ~ N ( 0 , σ 2 Δ ) und daher K n - p + 1 = ... = K n = 0 . Somitϵ^∼N(0,σ2Q) K∼N(0,σ2Δ) Kn−p+1=…=Kn=0
mit .K⋆=(K1,…,Kn−p)′
Da eine einheitliche Matrix ist, haben wir auchV
Somit
Beachten Sie schließlich, dass dieses Ergebnis dies impliziert
Da , teilt das Minimalpolynom von Q das Polynom z 2 - z . Die Eigenwerte von Q liegen also zwischen 0 und 1 . Da tr ( Q ) = n - p auch die Summe der Eigenwerte multipliziert mit ihrer Multiplizität ist, haben wir zwangsläufig, dass 1 ein Eigenwert mit der Multiplizität n - p und Null ein Eigenwert mit der Multiplizität p ist .Q2−Q=0 Q z2−z Q 0 1 tr(Q)=n−p 1 n−p p
quelle
IMHO kompliziert die matricial Notation Sachen. Reine Vektorraumsprache ist sauberer. Das Modell kann geschrieben werden als Y = μ + σ G, wobei G die Standardnormalverteilung auf R n hat und angenommen wird, dass μ zu einem Vektorsubraum W ⊂ R n gehört .Y=Xβ+ϵ Y=μ+σG G Rn μ W⊂Rn
Jetzt kommt die Sprache der Elementargeometrie ins Spiel. Die Least-Squares - Schätzfunktion μ von μ ist nichts anderes als P W Y : die orthogonale Projektion des beobachtbaren Y auf den Raum W , den μ angenommen wird , gehört. Der Vektor der Residuen ist P ⊥ W Y : Projektion auf das orthogonale Komplement W ⊥ von W in R n . Die Dimension von W ⊥ ist dim ( W ⊥ ) = n -μ^ μ PWY Y W μ P⊥WY W⊥ W Rn W⊥ .dim(W⊥)=n−dim(W)
Schließlich ist und P ⊥ W G hat die Standardnormalverteilung auf W ⊥ , daher hat seine quadratische Norm die χ 2- Verteilung mit dim ( W ⊥ ) Freiheitsgrade.
Diese Demonstration verwendet nur einen Satz, eigentlich einen Definitionssatz:
Definition und Satz . Ein Zufallsvektor in hat die Standardnormalverteilung auf einem Vektorraum U ⊂ R n, wenn er seine Werte in U und seine Koordinaten in einem (Rn U⊂Rn U ⟺ Insgesamt sind orthonormale Basis von unabhängige eindimensionale StandardnormalverteilungenU
(Aus diesem Definitionssatz geht hervor, dass der Satz von Cochran so offensichtlich ist, dass es sich nicht lohnt, ihn anzugeben.)
quelle