Ich denke, die Antwort sollte ja sein, aber ich habe immer noch das Gefühl, dass etwas nicht stimmt. Es sollte einige allgemeine Ergebnisse in der Literatur geben, könnte mir jemand helfen?
covariance
matrix
covariance-matrix
linear-algebra
Jingjings
quelle
quelle
Antworten:
Nein.
Betrachten wir drei Variablen , und . Ihre Kovarianzmatrix ist nicht eindeutig positiv, da es einen Vektor ( ) gibt, für den nicht positiv ist.Y Z = X + Y M z = ( 1 , 1 , - 1 ) ' z ' M zX Y Z=X+Y M z =(1,1,−1)′ z′Mz
Populationskovarianzmatrizen sind positiv semidefinit.
(Siehe Eigenschaft 2 hier .)
Gleiches sollte generell für Kovarianzmatrizen vollständiger Stichproben gelten (keine fehlenden Werte), da diese auch als diskrete Populationskovarianz angesehen werden können.
Aufgrund der Ungenauigkeit numerischer Gleitkommaberechnungen können jedoch gelegentlich auch algebraisch positive definite Fälle berechnet werden, die nicht einmal positiv semidefinit sind. Eine gute Auswahl an Algorithmen kann dabei helfen.
Allgemeiner gesagt, können Stichproben-Kovarianzmatrizen - abhängig davon, wie sie mit fehlenden Werten in einigen Variablen umgehen - auch theoretisch positiv sein oder nicht. Wenn zum Beispiel paarweise gelöscht wird, gibt es keine Garantie für eine positive Halbbestimmtheit. Darüber hinaus kann ein akkumulierter numerischer Fehler dazu führen, dass Stichproben-Kovarianzmatrizen, die im fiktiven Sinne positiv sein sollten, semidefinit bleiben.
Wie so:
Dies geschah im ersten Beispiel, das ich ausprobiert habe (ich sollte wahrscheinlich einen Samen liefern, aber es ist nicht so selten, dass Sie viele Beispiele ausprobieren müssen, bevor Sie einen bekommen).
Das Ergebnis fiel negativ aus , obwohl es algebraisch null sein sollte. Ein anderer Satz von Zahlen kann eine positive Zahl oder eine "exakte" Null ergeben.
-
Beispiel für ein moderates Fehlen, das durch paarweises Löschen zum Verlust der positiven Halbwertszeit führt:
quelle
Um zu verstehen, warum die Kovarianzmatrix einer Population immer positiv ist, beachten Sie : wobei einige reelle Zahlen und einige reelle Zufallsvariablen sind.
Dies erklärt auch, warum in dem von Glen_b gegebenen Beispiel die Kovarianzmatrix nicht eindeutig positiv war. Wir hatten und , also ist und Die Varianz einer Zufallsvariablen, die konstant ist, ist .X 1 = X , X 2 = Y , X 3 = Z = X + Y ≤ 3 i = 1 y i X i = 0 0y1=1,y2=1,y3=−1 X1=X,X2=Y,X3=Z=X+Y ∑3i=1yiXi=0 0
quelle