Ist jede Korrelationsmatrix positiv eindeutig?

11

Ich spreche hier von Matrizen von Pearson-Korrelationen.

Ich habe oft gehört, dass alle Korrelationsmatrizen positiv semidefinit sein müssen. Mein Verständnis ist, dass positive bestimmte Matrizen Eigenwerte , während positive semidefinite Matrizen Eigenwerte 0 haben müssen . Dies lässt mich denken, dass meine Frage wie folgt umformuliert werden kann: "Können Korrelationsmatrizen einen Eigenwert = 0 haben ?">00=0

Kann eine Korrelationsmatrix (generiert aus empirischen Daten ohne fehlende Daten) einen Eigenwert oder einen Eigenwert < 0 haben ? Was wäre, wenn es stattdessen eine Populationskorrelationsmatrix wäre?=0<0

Ich habe oben die Antwort auf diese Frage über Kovarianzmatrizen gelesen , die

Betrachten wir drei Variablen , Y und Z = X + Y . Ihre Kovarianzmatrix M ist nicht eindeutig positiv, da es einen Vektor z ( = ( 1 , 1 , - 1 ) ' ) gibt, für den z ' M z nicht positiv ist.XYZ=X+YMz=(1,1,1)zMz

Wenn ich jedoch anstelle einer Kovarianzmatrix diese Berechnungen auf einer Korrelationsmatrix durchführe, wird als positiv ausgegeben. Daher denke ich, dass die Situation für Korrelations- und Kovarianzmatrizen möglicherweise anders ist.zMz

Mein Grund für die Frage ist, dass ich beim Stackoverflow im Zusammenhang mit einer Frage, die ich dort gestellt habe, gefragt wurde.

user1205901 - Monica wiederherstellen
quelle
Wenn zum Beispiel zwei Attribute eine Sache sind und nur unterschiedliche Namen haben, ist die Matrix singulär. Wenn zwei Attribute zu einer Konstanten addieren, ist sie wieder singulär und so weiter .
ttnphns
Wenn eine Kovarianzmatrix singulär ist, ist auch die Korrelationsmatrix singulär.
ttnphns
2
Nahezu doppelte Werte: Ist jede Korrelationsmatrix positiv semidefinit? die weniger Fokus auf den bestimmten gegenüber dem halbbestimmten Winkel hat, und ist jede Kovarianzmatrix positiv definitiv? Dies ist relevant, da eine Kovarianz im Wesentlichen eine neu skalierte Korrelation ist.
Silverfish

Antworten:

16

Korrelationsmatrizen müssen nicht eindeutig positiv sein.

Betrachten Sie eine skalare Zufallsvariable X mit einer Varianz ungleich Null. Dann ist die Korrelationsmatrix von X mit sich selbst die Matrix aller, die positiv halbdefinit, aber nicht positiv definit ist.

Berücksichtigen Sie für die Probenkorrelation die Probendaten für das Obige mit der ersten Beobachtung 1 und 1 und der zweiten Beobachtung 2 und 2. Dies führt dazu, dass die Probenkorrelation die Matrix aller ist, also nicht eindeutig positiv.

Eine Beispielkorrelationsmatrix kann, wenn sie in exakter Arithmetik berechnet wird (dh ohne Rundungsfehler), keine negativen Eigenwerte haben.

Mark L. Stone
quelle
4
Erwähnenswert sind möglicherweise die möglichen Auswirkungen fehlender Werte auf die Stichproben-Korrelationsmatrix . Numerischer Fuzz ist nicht der einzige Grund, einen negativen Eigenwert in einer Stichprobenkorrelations- / Kovarianzmatrix zu erhalten.
Silverfish
1
Ja, ich habe es nicht explizit gemacht, aber ich ging laut Fragestellung davon aus, "ohne fehlende Daten". Sobald Sie in die wilde, verrückte Welt der fehlenden Daten und Anpassungen dafür geraten, ist alles möglich.
Mark L. Stone
Ja, tut mir leid, Sie haben völlig Recht, die Frage lautete "Keine fehlenden Daten" - ich dachte nur, es wäre erwähnenswert, da zukünftige Suchende interessiert sein könnten, selbst wenn der Appetit des OP gestillt ist!
Silverfish
7

X1=X2X1=2X2

n<pn1pn+1n1

Amöbe sagt Reinstate Monica
quelle
Das ist wahr. Ich nehme an, ich hätte diese Informationen auch liefern können und sollen, aber mein Ziel war es, ein Gegenbeispiel zu erstellen, um die Hypothese des OP zu widerlegen und damit seine Ungültigkeit zu zeigen. Trotzdem sollten Sie Ihren zweiten Satz so anpassen, dass er "In diesem Fall Kovarianz- und Korrelationsmatrizen" lautet wird höchstens Rang n - 1 sein, so dass es mindestens (p - n + 1) Null-Eigenwerte gibt. "
Mark L. Stone
4

XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
XY
Yoki
quelle
2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2
diagΛ1/2ΛdiagΛ1/2
@AntoniParellada, ich bin mir nicht ganz sicher, was du meinst - die Kovarianz hier ist eine direkte Berechnung. Aber ich werde das bearbeiten und klarer machen. Vielen Dank.
Yoki