Es gibt drei Zufallsvariablen, . Die drei Korrelationen zwischen den drei Variablen sind gleich. Das ist,
Was ist die engste Grenze, die Sie für geben können ?
correlation
correlation-matrix
user1352399
quelle
quelle
Antworten:
Die gemeinsame Korrelation kann den Wert + 1 haben, aber nicht - 1 . Wenn ρ X , Y = ρ X , Z = - 1 , dann kann ρ Y , Z nicht gleich - 1 sein, sondern ist tatsächlich + 1 . Der kleinste Wert der gemeinsamen Korrelation von drei Zufallsvariablen ist - 1ρ +1 −1 ρX,Y=ρX,Z=−1 ρY,Z −1 +1 . Allgemeiner ist die minimale gemeinsame Korrelation vonnZufallsvariablen-1−12 n
wenn sie als Vektoren betrachtet an den Eckpunkten eines Simplex (der Dimensionn-1) imn-dimensionalen Raum liegen.−1n−1 n−1 n
Betrachten Sie die Varianz der Summe der Zufallsvariablen X i der Varianz von Einheiten . Wir haben das var ( n ∑ i = 1 X i )n Xi
wobei ˉ ρ derDurchschnittswertvon ( n
Der Durchschnittswert eines Korrelationskoeffizienten beträgt also mindestens . WennalleKorrelationskoeffizienten dengleichenWertρ haben, ist ihr Durchschnitt ebenfalls gleichρ,und wir haben daher ρ≥-1−1n−1 ρ ρ
Ist es möglich, Zufallsvariablen zu haben, für die der gemeinsame Korrelationswertρgleich-1 ist?
quelle
Die engstmöglichen gebunden ist .−1/2≤ρ≤1 Alle diese Werte können tatsächlich auftreten - keiner ist unmöglich.
Um zu zeigen, dass das Ergebnis weder besonders tief noch mysteriös ist, stellt diese Antwort zunächst eine vollständig elementare Lösung dar, die nur die offensichtliche Tatsache voraussetzt, dass Varianzen - die erwarteten Werte von Quadraten - nicht negativ sein dürfen. Darauf folgt eine allgemeine Lösung (die etwas komplexere algebraische Fakten verwendet).
Elementare Lösung
Die Varianz einer Linearkombination von darf nicht negativ sein.x,y,z Lassen Sie die Varianzen dieser Variablen und & ugr; 2 , respectively. Alle sind ungleich Null (da sonst einige der Korrelationen nicht definiert würden). Unter Verwendung der grundlegenden Eigenschaften von Varianzen können wir berechnenσ2,τ2, υ2
für alle reellen Zahlen .( α , β, γ)
Unter der Annahme , , eine wenig algebraische Manipulation bedeutet dies äquivalent zuα + β+ γ≠ 0
Der quadratische Term auf der rechten Seite ist das Verhältnis zweier Potenzmittel von . Die Elementarstrom-mean Ungleichung (mit Gewichten ( 1 / 3 , 1 / 3 , 1 / 3 ) ) behauptet , dass Verhältnis nicht überschreiten kann 1 (und wird gleich 1 , wenn α = β = & ggr; & ne; 0 ). Ein bisschen mehr Algebra bedeutet dann(α,β,γ) (1/3,1/3,1/3) 1 1 α=β=γ≠0
Das explizite Beispiel für unterhalb ( unter Einbeziehung trivariaten Normale Variablen ( x , y , z ) ) zeigt , dass alle diese Werte, - 1 / 2 ≤ & rgr; ≤ 1 , tatsächlich als Korrelationen entstehen können. In diesem Beispiel wird nur die Definition multivariater Normalen verwendet, andernfalls werden keine Ergebnisse von Calculus oder Linear Algebra aufgerufen.n=3 (x,y,z) −1/2≤ρ≤1
Allgemeine lösung
Überblick
Jede Korrelationsmatrix ist die Kovarianzmatrix der standardisierten Zufallsvariablen, daher muss sie - wie alle Korrelationsmatrizen - positiv semidefinit sein. Entsprechend sind seine Eigenwerte nicht negativ. Dies stellt eine einfache Bedingung auf : es darf nicht als nicht weniger sein - 1 / 2 (und natürlich darf nicht länger als 1 ). Umgekehrt entspricht jedes solche ρ tatsächlich der Korrelationsmatrix einiger trivariater Verteilungen, was beweist, dass diese Grenzen so eng wie möglich sind.ρ −1/2 1 ρ
Herleitung der Bedingungen aufρ
Betrachten Sie die Korrelationsmatrix mal n , wobei alle Werte außerhalb der Diagonale gleich ρ sind . (Die Frage betrifft den Fall n = 3 , aber diese Verallgemeinerung ist nicht schwieriger zu analysieren.) Nennen wir es C ( ρ , n ) . Per Definition ist λ ein Eigenwert von, vorausgesetzt, es existiert ein Vektor ungleich Null x λ, so dassn n ρ. n=3, C(ρ,n). λ xλ
Diese Eigenwerte sind im vorliegenden Fall einfach zu finden, weil
Lassen Sie , berechnen Sie das1=(1,1,…,1)′
Lassen Sie mit einer 1 nur an der j- ten Stelle (für j = 2 , 3 , … , n ), berechnen Sie diesyj=(−1,0,…,0,1,0,…,0) 1 jth j=2,3,…,n
Da sich die bisher gefundenen Eigenvektoren über den gesamten n- dimensionalen Raum erstrecken (Beweis: Eine einfache Zeilenreduktion zeigt, dass der Absolutwert ihrer Determinante gleich n ist , was ungleich Null ist), bilden sie eine Basis für alle Eigenvektoren. Wir haben daher alle Eigenwerte gefunden und festgestellt, dass sie entweder 1 + ( n - 1 ) ρ oder 1 - ρ sind (letztere mit der Multiplizität n - 1 ). Neben der bekannten Ungleichung - 1 ≤ ρ ≤ 1n n n 1+(n−1)ρ 1−ρ n−1 −1≤ρ≤1 durch alle Korrelationen erfüllt, impliziert die Nicht-Negativität des ersten Eigenwerts weiter
während die Nicht-Negativität des zweiten Eigenwertes keine neuen Bedingungen auferlegt.
Nachweis der Angemessenheit der Bedingungen
Die Implikationen wirken in beide Richtungen: vorausgesetzt die Matrix C ( ρ , n ) nichtnegativ-definit und daher eine gültige Korrelationsmatrix. Es ist zum Beispiel die Korrelationsmatrix für eine Multinormalverteilung. Insbesondere schreiben−1/(n−1)≤ρ≤1, C(ρ,n)
für die Inverse von wenn - 1 / ( n - 1 ) < ρ < 1. Zum Beispiel, wenn n = 3C(ρ,n) −1/(n−1)<ρ<1. n=3
Mehr über die Nicht-Entartung
quelle
Ihre Korrelationsmatrix ist
Die Matrix ist positiv semidefinit, wenn die wichtigsten Minderjährigen alle nicht negativ sind. Die Hauptminderjährigen sind die Determinanten der "Nordwest" -Blöcke der Matrix, dh 1, die Determinante von
und die Determinante der Korrelationsmatrix selbst.
Sie sehen, dass die Funktion über den durch @stochazesthai angegebenen Bereich nicht negativ ist (was Sie auch überprüfen können, indem Sie die Wurzeln der Determinantengleichung finden).
quelle
quelle