Ist es möglich, dass 3 Vektoren alle negativen paarweisen Korrelationen haben?

16

Ist es bei drei gegebenen Vektoren , und möglich, dass die Korrelationen zwischen a und b , a und c und b und c alle negativ sind? Dh ist das möglich?b c a b a c b cabcabacbc

corr(a,b)<0corr(a,c)<0corr(b,c)<0
Antti A
quelle
3
Negative Korrelationen bedeuten geometrisch, dass die zentrierten Vektoren gegenseitig stumpfe Winkel bilden. Sie sollten kein Problem damit haben, eine Konfiguration von drei Vektoren in der Ebene zu zeichnen, die diese Eigenschaft haben.
Whuber
Sie können nicht vollständig negativ korreliert werden ( ρ=1 ), aber im Allgemeinen kann es eine negative Korrelation geben, die wiederum durch die anderen Korrelationen begrenzt wird.
Karakfa
2
@whuber Ihr Kommentar scheint Heikki Pulkkinens Antwort zu widersprechen, wonach Vektoren in einer Ebene unmöglich sind. Wenn Sie dazu stehen, sollten Sie Ihren Kommentar in eine Antwort verwandeln.
RM
2
@RM Es gibt keinen Widerspruch zwischen whuber und Heikki. Diese Frage fragt Datenmatrix X von n×3 groß. Normalerweise würden wir über n Datenpunkte in 3 Dimensionen sprechen, aber dieses Q spricht über drei "Vektoren" in n Dimensionen. Heikki sagt, dass alle negativen Korrelationen nicht auftreten können, wenn n=2 (tatsächlich sind zwei Punkte nach der Zentrierung immer perfekt korreliert, daher müssen die Korrelationen ±1 und können nicht alle 1 ). Whuber sagt, dass 3 Vektoren in n Dimensionen effektiv in einem zweidimensionalen Unterraum liegen können (dh X ist Rang 2) und schlägt vor, sich ein Mercedes-Logo vorzustellen.
Amöbe sagt Reinstate Monica
1
Verwandte: Gebunden für die Korrelation von drei Zufallsvariablen . (cc, @amoeba)
gung - Reinstate Monica

Antworten:

19

Es ist möglich, wenn der Vektor 3 oder größer ist. Beispielsweise

a=(1,1,1)b=(1,9,3)c=(2,3,1)

Die Korrelationen lauten

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

Wir können beweisen, dass dies für Vektoren der Größe 2 nicht möglich ist:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

Die Formel ist sinnvoll: Wenn größer als , muss größer als , damit die Korrelation negativ wird.a 2 b 1 b 1a1a2b1b1

Ähnliches gilt für Korrelationen zwischen (a, c) und (b, c)

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Es ist klar, dass alle diese drei Formeln nicht gleichzeitig gelten können.

Heikki Pulkkinen
quelle
3
Ein weiteres Beispiel für etwas Unerwartetes, das nur in Dimension drei oder höher auftritt.
n -
1
Bei Vektoren der Größe betragen die Korrelationen normalerweise ± 1 (gerade Linie durch zwei Punkte), und Sie können nicht drei Korrelationen von - 1 mit drei Vektoren beliebiger Größe haben2±11
Henry
9

Ja, sie können.

Angenommen, Sie haben eine multivariate Normalverteilung . Die einzige Einschränkung für Σ ist, dass es sich um ein positives Semidefinit handeln muss.XR3,XN(0,Σ)Σ

Nehmen wir also das folgende Beispiel Σ=(10.20.20.210.20.20.21)

Seine Eigenwerte sind alle positiv (1,2, 1,2, 0,6), und Sie können Vektoren mit negativer Korrelation erstellen.

Kozolovska
quelle
7

Beginnen wir mit einer Korrelationsmatrix für 3 Variablen

Σ=(1pqp1rqr1)

p,q,r

pqrp2+q2+r212

Wenn zum Beispiel , sind die Werte von r auf 2 r r 2 + 1 beschränkt , wodurch r erzwungen wirdp=q=1r2rr2+1r=1p=q=12r2±34

Beantwortung der interessanten Folgefrage von @amoeba: "Was ist die niedrigstmögliche Korrelation, die alle drei Paare gleichzeitig haben können?"

Sei , finde die kleinste Wurzel von 2 x 3 - 3 xp=q=r=x<02x33x2+112

r=12pqp2+q2p=q11

Karakfa
quelle
2
Siehe stats.stackexchange.com/questions/72790/... , unter anderem.
whuber
2

Eine einfache R-Funktion, um dies zu untersuchen:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

In Abhängigkeit von n, f(n)beginnt bei 0, wird bei n = 3(mit typischen Werten um 0,06) ungleich Null , steigt dann um etwa 0,11 an n = 15und scheint sich danach zu stabilisieren:

Bildbeschreibung hier eingeben Es ist also nicht nur möglich, dass alle drei Korrelationen negativ sind, es scheint auch nicht ungewöhnlich zu sein (zumindest bei gleichmäßigen Verteilungen).

John Coleman
quelle