Warum muss die Korrelationsmatrix positiv semidefinit sein und was bedeutet es, positiv semidefinit zu sein oder nicht?

34

Ich habe die Bedeutung der positiven semidefiniten Eigenschaft von Korrelations- oder Kovarianzmatrizen untersucht.

Ich suche Informationen zu

  • Definition der positiven Halbbestimmtheit;
  • Seine wichtigen Eigenschaften, praktische Implikationen;
  • Die Konsequenz einer negativen Determinante, Auswirkung auf multivariate Analyse- oder Simulationsergebnisse usw.
Melone
quelle
5
Möchten Sie verstehen, was Semidefinitität ist , oder möchten Sie wissen, warum Korrelationsmatrizen semidefinit sein müssen , oder möchten Sie wissen, welche wichtigen Ergebnisse diese Eigenschaft impliziert?
Whuber
4
Wenn Korrelationsmatrizen nicht halbpositiv eindeutig sind, können negative Varianzen auftreten.
Ich habe Ihre Frage ein wenig bearbeitet, bitte überprüfen Sie es. Beachten Sie auch, dass eine Matrix mit einer geraden Anzahl negativer Eigenwerte immer noch eine positive Determinante hat.
TTNPHNS
Eine Kovarianzmatrix ist NICHT immer gleich der Korrelationsmatrix! Die Kovarianz berücksichtigt normalisierte Variablen, die Korrelationsmatrix nicht.
Manoj Kumar
1
Verwandte Fragen: Ist jede Kovarianzmatrix positiv bestimmt? betrachtet den umfassenderen Fall von Kovarianzmatrizen, von denen Korrelationsmatrizen ein Sonderfall sind; auch ist jede Korrelationsmatrix positiv semidefinit? und Ist jede Korrelationsmatrix positiv definitiv?
Silverfish

Antworten:

38

Die Varianz einer gewichteten Summe von Zufallsvariablen darf für alle Auswahlen von reellen Zahlen a i nicht negativ sein . Da die Varianz als var ausgedrückt werden kann icheinichXicheinich

var(icheinichXich)=ichjeinicheinjcov(Xich,Xj)=ichjeinicheinjΣich,j,
wir haben, dass die Kovarianzmatrix positiv semidefinit sein muss (was manchmal nichtnegativ definit genannt wird). Recall , dass eine Matrix C positive semidefinite aufgerufen wird , wenn und nur wenn Σ i Σ j a i a j C i , j0Σ=[Σich,j]C
ichjeinicheinjCich,j0einich,einjR.
Dilip Sarwate
quelle
Vielen Dank, ich habe meine Ablehnung entfernt, aber ich habe keine Ablehnung erhalten, weil es keine Antwort auf die praktischen Auswirkungen gibt. Angenommen, ich habe eine Matrix, die nicht eindeutig positiv ist (z. B. aufgrund einer Änderung durch "Experte"). Was würde passieren, wenn ich damit Daten kalibriere und / oder simuliere? Ist dies ein echtes Problem, wenn versucht wird, eine große Summe zu studieren, und es gibt nur wenige negative Eigenwerte? Was wäre ein effizienter Algorithmus, um eine nicht positive semi-definite Korrelationsmatrix in eine positive semi-definite zu transformieren? Wie würde sich dieser Algorithmus auswirken?
Lcrmorin
@Were_cat Danke für die Umkehrung der Ablehnung.
Dilip Sarwate
Könnten Sie bitte die erste Gleichheit in der ersten Gleichung erklären?
Vivek Subramanian
1
@VivekSubramanian Varianz ist ein Sonderfall der Kovarianzfunktion: und die Kovarianzfunktion ist bilinear (dh sie ist eine lineare Funktion in Bezug auf jedes Argument: cov ( i a i X i , Y )var(X)=cov(X,X)
cov(icheinichXich,Y.)=icheinichcov(Xich,Y.)cov(X,ichbjY.j,)=jbjcov(X,Y.j)
Dilip Sarwate
18

Die Antwort ist ganz einfach.

Die Korrelationsmatrix ist folgendermaßen definiert:

Lassen Sie sei die m × n- Datenmatrix: m Beobachtungen, n Variablen.X=[x1,x2,...,xn]m×nmn

Definiere als die Matrix normalisierter Daten, wobeiμ1ein Mittelwert für die Variable 1 ist,μ2 einMittelwert für die Variable 2 usw. ist unds1die Standardabweichung für die Variable 1 usw. ist undeein Vektor aller 1s ist .Xb=[(x1μ1e)s1,(x2μ2e)s2,(x3μ3e)s3,...]μ1μ2s1e

Die Korrelationsmatrix ist dann

C=XbXb

Eine Matrix ist positiv semidefinit, wenn es keinen Vektor z gibt, so dass z ' A z < 0 ist .AzzAz<0

Angenommen, ist nicht eindeutig positiv. Dann existiert ein Vektor w, so dass w ' C w < 0 ist .CwCw<0

Jedoch wobeiz=Xbwund somitw'Cweine Summe von Quadraten ist und daher nicht kleiner als Null sein kann.(wCw)=(wXbXbw)=(Xbw)(Xbw)=z12+z22...z=XbwwCw

Somit ist nicht nur die Korrelationsmatrix, sondern jede Matrix , die in der Form V ' V geschrieben werden kann, positiv semidefinit.UVV

Gregor
quelle
2
Dies ist bei weitem die klarste und nützlichste Antwort. Vielen Dank !
Yohan Obadia
12

(Mögliche Ungenauigkeit in der Argumentation wäre meine. Ich bin kein Mathematiker: Dies ist eine Darstellung, kein Beweis und stammt aus meinen numerischen Experimenten, nicht aus Büchern.)

  1. Eine positive semidefinite (psd) Matrix, auch Gramian Matrix genannt, ist eine Matrix ohne negative Eigenwerte. Matrix mit negativen Eigenwerten ist nicht positiv semidefinit oder nicht grammisch. Beide können eindeutig (keine Null-Eigenwerte) oder singulär (mit mindestens einem Null-Eigenwert) sein. [Das Wort "Gramian" wird in der Mathematik in verschiedenen Bedeutungen verwendet, sollte also vielleicht vermieden werden.]
  2. In der Statistik wenden wir diese Begriffe normalerweise auf eine Matrix vom Typ SSCP an, die auch Skalarproduktmatrix genannt wird. Korrelations- oder Kovarianzmatrizen sind besondere Fälle einer solchen Matrix .
  3. npppnnKovarianzmatrix zwischen den Fällen. Wenn Sie es aus realen Daten berechnen, ist die Matrix immer Gramm. Sie können eine Nicht-Gramm-Matrix (Nicht-PSD-Matrix) erhalten, wenn (1) es sich um eine direkt gemessene Ähnlichkeitsmatrix handelt (dh nicht aus den Daten berechnet wurde) oder das Ähnlichkeitsmaß kein SSCP-Typ ist; (2) die Matrixwerte wurden falsch eingegeben; (3) Die Matrix ist in der Tat gramisch, ist aber (oder fast) singulär, so dass die spektrale Methode zur Berechnung von Eigenwerten manchmal winzige negative Einsen anstelle von echten Nullen oder winzigen positiven Einsen erzeugt.
  4. d122=h12+h22-2s12shXY.dxy2=σx2+σy2-2cOvxy
  5. mm
  6. mmm
  7. Was sind mögliche Ursachen oder Versionen einer nicht-gramischen (nicht-euklidischen) Konfiguration? Die Antworten folgen auf die Betrachtung [Punkt 4].
    • mmd
    • hddhh
    • dhh1+h2d12|h1-h2|
  8. |cOvichj|>σichσj

Abb1.

Fig1

Abb2.

Abb2

Abb. 3.

Abb. 3

ttnphns
quelle
2
Punkt 6 muss demonstriert werden: Sie haben gezeigt, dass eine Matrix aus quadratischen euklidischen Abständen pd ist, aber Sie behaupten, ohne zu beweisen, dass zu jeder pd-Matrix eine euklidische Punktekonfiguration gehört. Außerdem haben Sie Ihre Definition von pd ("keine negativen Eigenwerte") mit keiner Ihrer nachfolgenden Charakterisierungen in Verbindung gebracht. Die Schlüsselidee kommt am Ende (Punkt 8): Eine pd-Matrix kann verwendet werden, um einen Abstand zu definieren. Logischerweise sollten Sie hier mit der Analyse beginnen .
Whuber
@whuber: Danke für die kritische Bewertung. Ich fürchte, wenn es darum geht, etwas mathematisch zu beweisen , versinke ich. Ich habe über einen Teil meiner praktischen Erfahrung berichtet (das habe ich gesagt); Die Antwort war nicht wirklich eine analytische Sequenz. Möchten Sie dann nicht Ihre eigene Antwort hinzufügen, die meine korrigieren / verbessern kann? Es könnte sich als wertvolle Hilfe herausstellen. Es steht Ihnen aber auch frei, an meinem Text zu arbeiten, um ihn zu verbessern, wenn Sie ihn nicht für ausgesprochen zwecklos halten.
TTNPHNS
PS Mein Punkt 8 impliziert, dass, da die doppelte Zentrierung eine Konfiguration von Punkten an seinem Schwerpunkt verankert, diese Operation selbst keine Nichteuklidität einführt (sie erzeugt nur Singularität, weil der neue Punkt, Zentrum, zum selben Raum gehört). Von dort aus können wir überprüfen, ob die ursprüngliche Konfiguration euklidisch war. Stimmt das nicht
ttnphns