Vervollständigung einer 3x3-Korrelationsmatrix: Zwei Koeffizienten der drei angegebenen

20

Diese Frage wurde mir in einem Interview gestellt.

Nehmen wir an, wir haben eine Korrelationsmatrix der Form

[10,60.80,61γ0.8γ1]

Angesichts dieser Korrelationsmatrix wurde ich gebeten, den Wert von Gamma zu ermitteln.
Ich dachte, ich könnte etwas mit den Eigenwerten anfangen, da sie alle größer oder gleich 0 sein sollten. (Matrix sollte positiv semidefinit sein) - aber ich glaube nicht, dass dieser Ansatz die Antwort liefert. Mir fehlt ein Trick.

Könnten Sie uns bitte einen Lösungshinweis geben?

Anfänger
quelle
Kommentare sind nicht für eine längere Diskussion gedacht. Diese Unterhaltung wurde in den Chat verschoben .
Whuber
1
Eine Suche auf dieser Site führte direkt zu einem von (mehreren) Threads mit relevanten Formeln: stats.stackexchange.com/questions/5747 . In der Antwort von felix s finden sich auch einige nützliche Erklärungen .
Whuber

Antworten:

21

Wir wissen bereits, dass zwischen Die Korrelationsmatrix sollte positiv und semidefinit sein, und daher sollten ihre Hauptminderheiten nicht negativ seinγ[-1,1]

Somit ist

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96
rechtekewed
quelle
4
@novice Vielleicht möchten Sie etwas über Sylvesters Kriterium
am
Gute Antwort. Ich möchte Folgendes hinzufügen: Der gängige Weg, Gamma zu erhalten, besteht darin, zu versuchen, das Gamma zu finden, das zur Korrelationsmatrix der kleinsten möglichen Kernnorm (auch bekannt als Ky-Fan-Norm) führt, während die obigen Gleichungen gelöst werden. Weitere Informationen finden Sie in den Abschnitten "Matrixvervollständigung", " Druckmessung " oder in diesem Bericht zum Thema bit.ly/2iwY1nW .
Mustafa S Eisa
1
Um dies zu beweisen, benötigen Sie ein Ergebnis in die andere Richtung: Wenn alle nichttrivialen führenden Minderjährigen und die Matrix eine Determinante 0 hat , ist die Matrix positiv semidefinit. >00
Federico Poloni
10

Hier ist eine einfachere (und vielleicht intuitivere) Lösung:

Stellen Sie sich die Kovarianz als ein inneres Produkt über einem abstrakten Vektorraum vor . Dann werden die Einträge in der Korrelationsmatrix für die Vektoren v 1 , v 2 , v 3 , wobei die Eckwinkel v i , v j den bezeichneten Winkel zwischen v i und v j .cosvi,vjv1v2v3vi,vjvivj

Es ist nicht schwer zu visualisieren , dass begrenzt ist durch | v 1 , v 2± v 1 , v 3| . Die gebundene auf seiner Cosinus ( γ ) ist also cos [v 1 , v 2± v 1 , v 3] . Grundlegende Trigonometrie ergibt dann γ [ 0,6 ×v2,v3|v1,v2±v1,v3|γcos[v1,v2±v1,v3] .γ[0,6×0.8-0,6×0.8,0,6×0.8+0,6×0.8]=[0,0,96]

Edit: Beachten Sie, dass die in der letzten Zeile ist wirklich cos v 1 , v 2cos v 1 , v 3sin v 1 , v 3sin v 1 , v 2 - das zweite Auftreten von 0,6 und 0,8 erfolgt durch Zufall dank 0,6 2 + 0,8 2 = 10,6×0.80,6×0.8cosv1,v2cosv1,v3Sündev1,v3Sündev1,v20,62+0.82=1.

yangle
quelle
1
+1, Eine legitime geometrische Argumentation (ich habe Ihre Berechnungen trotzdem nicht überprüft). Dies ist genau das, was ich in den Kommentaren zu der Frage vorgeschlagen habe (leider wurden alle Kommentare vom Moderator in den Chat verschoben, siehe den obigen Link).
TTNPHNS
Mir scheint, Sie haben "bewiesen", dass alle Korrelationen nicht negativ sein dürfen, denn es scheint, dass Ihre Berechnung für die untere Grenze immer Null ergibt. Wenn dies nicht der Fall ist, können Sie dann erläutern, wie Ihre Berechnung im Allgemeinen funktioniert? Ich vertraue deiner Grenze wirklich nicht - oder verstehe sie vielleicht nicht -, weil du in drei oder mehr Dimensionen immer ein findest, für das v 1v 2 = v 1v 3 = 0 und dann Ihre Schranke impliziert, dass v 2v 3 immer Null ist! (cc @ttnphns)v1v1v2=v1v3=0v2v3
whuber
@whuber: Entschuldige die Verwirrung. Die Berechnung ergibt nicht immer Null für die Untergrenze. Ich habe meine Antwort geändert.
Yangle
Wie reagieren Sie auf meine letzte Sorge? Es scheint darauf hinzudeuten, dass Ihre Grenzen falsch sind.
Whuber
@whuber: In Ihrem Fall ist ⟨v1, v2⟩ = ⟨v1, v3⟩ = π / 2, daher die Schranke | ⟨v1, v2⟩ ± ⟨v1, v3⟩ | ist wie erwartet [0, π]. Der gebundene cos⟨v1, v2⟩cos⟩v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2⟩ auf γ ist ebenfalls [-1, 1].
Yangle
4

Hier ist, was ich in meinem ersten Kommentar zur Antwort gemeint habe und worüber ich @yangle als sprechend empfinde (obwohl ich deren Berechnung nicht verfolgt / überprüft habe).

"Matrix sollte positiv semidefinit sein" impliziert, dass die variablen Vektoren eine Menge im euklidischen Raum sind. Der Fall der Korrelationsmatrix ist einfacher als die Kovarianzmatrix, da die drei Vektorlängen auf 1 festgelegt sind. Stellen Sie sich 3 Einheitsvektoren XYZ vor und denken Sie daran, dass der Kosinus des Winkels ist . So cos α = r x y = 0,6 , und cos β = r y z = 0,8 . Was könnten die Grenzen für cos γ = r x z sein ?rcosα=rxy=0.6cosβ=ryz=0.8cosγ=rxz? Diese Korrelation kann jeden Wert annehmen, der durch Z definiert ist, das um Y umschreibt (wobei der Winkel beibehalten wird):ryz=0.8

Bildbeschreibung hier eingeben

Während des Drehens sind zwei Positionen als endgültig für X bemerkenswert. Beide sind, wenn Z in die Ebene XY fällt. Einer liegt zwischen X und Y und der andere befindet sich auf der gegenüberliegenden Seite von Y. Diese sind durch blaue und rote Vektoren dargestellt. An diesen beiden Positionen ist genau die Konfiguration XYZ (Korrelationsmatrix) singulär. Und dies sind der minimale und maximale Winkel (daher Korrelation), den Z für X erreichen kann.

Wenn Sie die trigonometrische Formel auswählen, um die Summe oder die Winkeldifferenz in einer Ebene zu berechnen, haben Sie folgende Möglichkeiten:

als Grenzen.cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96]

Diese geometrische Ansicht ist nur eine andere (und in 3D eine spezielle und einfachere) Betrachtung dessen, was @rightskewed in algebraischen Begriffen ausdrückt (Minderjährige usw.).

ttnphns
quelle
Wenn X, Y, Z Zufallsvariablen sind, wie ordnen Sie sie Vektoren im 3D-Raum zu (sie können nur Vektoren im 1D-Raum sein)? Auch wenn die RVs Nx1 sind, dann sind sie Vektoren im N-dimensionalen Raum?
Anfänger
@novice Ja, es sind anfänglich 3 Vektoren im Nd-Raum, aber nur 3 Dimensionen sind nicht redundant. Bitte folgen Sie dem 2. Link in der Antwort und lesen Sie dort den weiteren Verweis auf den Themenbereich, in dem er erklärt wird.
TTNPHNS
4

Das Herumspielen mit Hauptminderjährigen mag bei 3 mal 3 oder vielleicht 4 mal 4 Problemen in Ordnung sein, aber in höheren Dimensionen geht das Benzin und die numerische Stabilität aus.

Für ein einzelnes "freies" Parameterproblem wie dieses ist leicht zu erkennen, dass die Menge aller Werte, die die Matrix psd bilden, ein einzelnes Intervall ist. Daher ist es ausreichend, die minimalen und maximalen Werte zu finden. Dies kann leicht durch numerisches Lösen zweier linearer SemiDefinite Programming (SDP) -Probleme erreicht werden:

  1. minimiere γ abhängig von der Matrix ist psd.
  2. maximiere γ abhängig von der Matrix ist psd.

Beispielsweise können diese Probleme mit YALMIP unter MATLAB formuliert und numerisch gelöst werden.

  1. gamma = sdpvar; A = [1,6,8; 6,1 gamma; 0,8 gamma 1]; optimieren (A> = 0, Gamma)
  2. optimieren (A> = 0, -gamma)

Schnell, einfach und zuverlässig.

Übrigens, wenn der Interviewer von Smarty Pants, der die Frage stellt, nicht weiß, dass SemiDefinite Programming, das ausgereifte und einfach zu verwendende numerische Optimierer zum zuverlässigen Lösen praktischer Probleme enthält, zur Lösung dieses Problems verwendet werden kann, und vieles mehr In schwierigen Varianten sagen Sie ihm, dass dies nicht mehr das Jahr 1870 ist und es an der Zeit ist, moderne rechnerische Entwicklungen zu nutzen.

Mark L. Stone
quelle
4

Betrachten wir die folgende konvexe Menge

{(x,y,z)R3:[1xyx1zyz1]O3}

3

Bildbeschreibung hier eingeben

x=0,6y=0.8

Bildbeschreibung hier eingeben

Die Grenze des Elliptops ist eine kubische Fläche, definiert durch

det[1xyx1zyz1]=1+2xyz-x2-y2-z2=0

x=0,6y=0.8

0,96z-z2=z(0,96-z)=0

Der Schnittpunkt des Elliptops mit den beiden Ebenen ist also das durch parametrisierte Liniensegment

{(0,6,0.8,t)0t0,96}
Rodrigo de Azevedo
quelle
1

Jede positive semi-definite Matrix ist eine Korrelations- / Kovarianzmatrix (und umgekehrt).

EINEINEIN=UDUTUDB=UD1/2UTD1/2

xBxA

R=E[xxT]R=RTaTRa=E[(aTx)2]0aR

2nn

Batman
quelle