Der Nenner des (unverzerrten) Varianzschätzers ist da Beobachtungen vorliegen und nur ein Parameter geschätzt wird.
Aus dem gleichen Grund frage ich mich, warum der Nenner der Kovarianz nicht wenn zwei Parameter geschätzt werden.
Der Nenner des (unverzerrten) Varianzschätzers ist da Beobachtungen vorliegen und nur ein Parameter geschätzt wird.
Aus dem gleichen Grund frage ich mich, warum der Nenner der Kovarianz nicht wenn zwei Parameter geschätzt werden.
Antworten:
Kovarianzen sind Varianzen.
Da durch die Polarisationsidentität
Die Nenner müssen gleich sein.
quelle
Ein spezieller Fall sollte Ihnen eine Intuition geben; Denken Sie an Folgendes:
Sie sind froh, dass letztere ist Bessel-Korrektur.∑ni=1(Xi−X¯¯¯¯¯)2n−1
Aber wenn Sie durch in für das erstere ersetzen, erhalten Sie , was könnte Ihrer Meinung nach am besten ausfüllen?Y X Cov^(X,Y) ∑ni=1(Xi−X¯¯¯¯¯)(Xi−X¯¯¯¯¯)mystery denominator
quelle
Eine schnelle und schmutzige Antwort ... Betrachten wir zuerst ; Wenn Sie Beobachtungen mit bekanntem Erwartungswert , würden Sie , um die Varianz zu schätzen.var(X) n E(X)=0 1n∑ni=1X2i
Da der erwartete Wert unbekannt ist, können Sie Ihre Beobachtungen in Beobachtungen mit bekanntem erwarteten Wert umwandeln, indem Sie für . Sie erhalten eine Formel mit einem im Nenner - die sind jedoch nicht unabhängig und müssen dies berücksichtigen; Am Ende findest du die übliche Formel.n n−1 Ai=Xi−X1 i=2,…,n n−1 Ai
Jetzt für die Kovarianz können Sie die gleiche Idee verwenden: Wenn der Erwartungswert von ist , würden Sie haben einen in der Formel. Wenn Sie von allen anderen beobachteten Werten subtrahieren , erhalten Sie Beobachtungen mit bekanntem Erwartungswert ... und einem in der Formel Konto.(X,Y) (0,0) 1n (X1,Y1) n−1 1n−1
PS Die saubere Art und Weise zu tun , ist eine orthonormale Basis wählen , das heißt Vektoren so dass⟨(1,…,1)′⟩⊥ n−1 c1,…,cn−1∈Rn
Sie können dann Variablen definieren: und . Die sind unabhängig, haben einen erwarteten Wert und haben die gleiche Varianz / Kovarianz wie die ursprünglichen Variablen.n−1 Ai=∑jcijXj Bi=∑jcijYj (Ai,Bi) (0,0)
Der springende Punkt ist, dass, wenn Sie die unbekannte Erwartung loswerden möchten, Sie eine (und nur eine) Beobachtung fallen lassen. Dies funktioniert in beiden Fällen gleich.
quelle
Hier ist ein Beweis, dass der p-variable Stichproben-Kovarianzschätzer mit dem Nenner ein unverzerrter Schätzer der Kovarianzmatrix ist:1n−1
So zeigen Sie:E(S)=n−1nΣ
Beweis:S=1n∑xix′i−x¯x¯′
Nächster:
(1)E(xix′i)=Σ+μμ′
(2)E(x¯x¯′)=1nΣ+μμ′
Deshalb:E(S)=Σ+μμ′−(1nΣ+μμ′)=n−1nΣ
Und so ist mit dem letzten Nenner unvoreingenommen. Die nicht diagonalen Elemente von sind Ihre individuellen Beispielkovarianzen.Su=nn−1S 1n−1 Su
Zusätzliche Bemerkungen:
Die n Ziehungen sind unabhängig. Dies wird in (2) verwendet, um die Kovarianz des Stichprobenmittelwerts zu berechnen.
Schritt (1) und (2) verwenden die Tatsache, dassCov(x)=E[xx′]−μμ′
Schritt (2) verwendet die Tatsache, dassCov(x¯)=1nΣ
quelle
Ich vermute, eine Möglichkeit, die Intuition hinter der Verwendung von 'n-1' und nicht 'n-2' aufzubauen, besteht darin, dass wir für die Berechnung der Kovarianz nicht beide Bedeutungen von X und Y aufheben müssen, sondern eine der beiden
quelle
1) Starten Sie .df=2n
2) Die ist proportional zu . Verliere zwei ; eine aus , eine aus was zu .Σni=1(Xi−X¯)(Yi−Y¯) df X¯ Y¯ df=2(n−1)
3) enthält jedoch nur separate Begriffe, einen von jedem Produkt. Wenn zwei Zahlen miteinander multipliziert werden, verschwinden die unabhängigen Informationen von jeder einzelnen Zahl.Σni=1(Xi−X¯)(Yi−Y¯) n
Betrachten Sie das als ein banales Beispiel
und das schließt Irrationalen und Brüche nicht ein, zB , so dass wir, wenn wir zwei Zahlenreihen miteinander multiplizieren und ihr Produkt untersuchen, nur aus einer Zahlenreihe, da wir die Hälfte der ursprünglichen Informationen verloren haben, d. h. was diese beiden Zahlen waren, bevor die paarweise Gruppierung in eine Zahl (dh Multiplikation) durchgeführt wurde.24=26–√∗26–√ df=n−1
Mit anderen Worten, ohne Verlust der Allgemeinheit können wir schreiben
dh und, . Aus den , die dann eindeutig , wird die Kovarianzformelzi=XiYi−X¯Yi−XiY¯ z¯=X¯Y¯ z df=n−1
Die Antwort auf die Frage lautet also, dass die durch Gruppierung halbiert werden.df
quelle
Hold
?