Wie in dieser Frage festgestellt , ist der maximale Rang der Kovarianzmatrix wobei die Stichprobengröße ist. Wenn die Dimension der Kovarianzmatrix also der Stichprobengröße entspricht, wäre sie singulär. Ich kann nicht verstehen, warum wir vom maximalen Rang der Kovarianzmatrix subtrahieren .n 1 n
covariance-matrix
linear-algebra
user3070752
quelle
quelle
Antworten:
Der unverzerrte Schätzer der Stichproben-Kovarianzmatrix mitn Datenpunkten ist wobei der Durchschnitt über alle Punkte ist. Wir bezeichnen als . Der Faktor ändert den Rang nicht, und jeder Term in der Summe hat (per Definition) Rang , sodass der Kern der Frage wie folgt lautet:C = 1xich∈ Rd ˉ x =Σxi/n(xi- ˉ x )zi1
Warum hat Rang und nicht Rang , wie es scheint, weil wir Rang- Matrizen summieren ? n - 1 n n 1∑ zichz⊤ich n - 1 n n 1
Die Antwort ist, dass es passiert, weil nicht unabhängig sind. Nach Konstruktion ist . Wenn Sie also von , ist der letzte verbleibende vollständig bestimmt. Wir summieren nicht unabhängige Rang- Matrizen, sondern nur unabhängige Rang- Matrizen und addieren dann eine weitere Rang- Matrix, die vom Rest vollständig linear bestimmt wird. Diese letzte Addition ändert nichts am Gesamtrang. ≤ z i =0zi ∑zi=0 z i z n n 1 n - 1 1 1n−1 zi zn n 1 n−1 1 1
Wir können dies direkt sehen, wenn wir als umschreiben und es jetzt in den obigen Ausdruck :Jetzt gibt es nur noch Terme in der Summe und es wird klar, dass die gesamte Summe höchstens den Rang .Z n = - n - 1 Σ i = 1 Z i , n Σ i = 1 z i z ⊤ i = n - 1 Σ i = 1 z i z ⊤ i + ( - n - 1 Σ i = 1 z i ) z ⊤ n = n -∑zi=0
Dieses Ergebnis weist übrigens darauf hin, warum der Faktor im unverzerrten Kovarianzschätzer und nicht . 11n−1 1n
Die geometrische Intuition, auf die ich in den obigen Kommentaren angespielt habe, ist, dass man eine 1D-Linie immer an zwei beliebige Punkte in 2D anpassen kann und eine 2D-Ebene immer an drei beliebige Punkte in 3D anpassen kann, dh die Dimensionalität des Unterraums ist immer ; Dies funktioniert nur, weil wir davon ausgehen, dass diese Linie (und Ebene) "verschoben" werden kann, um unsere Punkte anzupassen. Das "Positionieren" dieser Linie (oder Ebene) durch entspricht dem Zentrieren im obigen algebraischen Argument.ˉ xn−1 x¯
quelle