Gibt es Grenzen für die Spearman-Korrelation einer Summe zweier Variablen?

8

Gegeben -Vektoren , so daß der Korrelationskoeffizient nach Spearman von und ist , gibt es bekannte Grenzen auf dem Spearman Koeffizienten mit , in Bezug auf die (und vermutlich)? Das heißt, kann man (nicht triviale) Funktionen so finden, dass x , y 1 , y 2 x y i ρ i = ρ ( x , y i ) x y 1 + y 2 ρ i n l ( ρ 1 , ρ 2 , n ) , u ( ρ 1 , ρ 2 , n ) l ( ρ 1 , ρ 2 , n )nx,y1,y2xyiρi=ρ(x,yi)xy1+y2ρinl(ρ1,ρ2,n),u(ρ1,ρ2,n)

l(ρ1,ρ2,n)ρ(x,y1+y2)u(ρ1,ρ2,n)

edit : Nach dem Beispiel von @ whuber im Kommentar scheint es, dass im allgemeinen Fall nur die trivialen Grenzen können. Daher möchte ich die Einschränkung weiter auferlegen:l=1,u=1

  • y1,y2 sind Permutationen der ganzen Zahlen .1n
shabbychef
quelle
2
Nur wenn man kennt , muss das Intervall, das enthält, und : für jedes könnte sehr kleine Werte haben (während sie eine beliebige Rangfolge haben) und somit einfach die Werte in "jittern", wenn sie zu hinzugefügt werden . Somit würde die Rangfolge von nicht beeinflusst. Ich weiß nicht, ob das Intervall überschreiten kann . ρ ( x , y 1 + y 2 ) ρ 1 ρ 2 y 1 , y 2 y 1 y 1 y 1 ρ iρ1,ρ2ρ(x,y1+y2)ρ1ρ2y1,y2y1y1y1ρi
Caracal
2
@caracal Gute Beobachtungen. Das Intervall kann definitiv breiter sein als das : Betrachten nur den Fall, in dem beide Korrelationen Null sind. Die Korrelation mit der Summe kann leicht ungleich Null sein - sie kann von -1 bis 1 reichen. ZB x = (1,2,3,4,5); y1 = (3, -10,2,10,1); y2 = (-8,9, -2, -9,4); y1 + y2 = (-5, -1,0,1,5) hat aber . ρ 1 = ρ 2 = 0 ρ = 1ρiρ1=ρ2=0ρ=1
whuber
@whuber: Dies scheint zu implizieren, dass nur triviale Grenzen existieren (dh ). Vielleicht muss ich das Problem noch einmal einschränken. l=1,u=1
Shabbychef
@shabbychef Nein, du hast ein schönes Problem gepostet: Es ist nicht trivial. Im Fall von ist die einzige Möglichkeit beispielsweise . Ich vermute, die Grenzen sind nicht trivial, außer wenn ; Sie müssen enger werden, wenn sich und nähern . ρ = 1 ρ 1 = ρ 2 = 0 ρ 1 ρ 2 ± 1ρ1=ρ2=1ρ=1ρ1=ρ2=0ρ1ρ2±1
whuber
1
Hier ist ein weiterer pathologischer Fall. Angenommen, und . Dann ist , aber und . Es könnte aufschlussreich sein, über eine einfachere, probabilistische Version des Problems nachzudenken. Sei , und Zufallsvariablen mit jeweils geringfügig gleichmäßigen Verteilungen. Nun sei die CDF von . Was können wir über sagen basierend auf und ? y 1 = - y 2 ρ ( x , y 1 + y 2 ) = 0 ρ 1 = 1 ρ 2 = - 1 X Y 1 Y 2 G Y 1 + Y 2 C o v ( X , G ( Y 1 + Y 2 ) ) C o v (x=y1y1=y2ρ(x,y1+y2)=0ρ1=1ρ2=1XY1Y2GY1+Y2Cov(X,G(Y1+Y2))C o v ( X , Y 2 )Cov(X,Y1)Cov(X,Y2)
VQV

Antworten:

4

Die Rangkorrelation nach Spearman ist nur die Pearson-Produkt-Moment-Korrelation zwischen den Rängen der Variablen. Shabbychefs zusätzliche Einschränkung bedeutet, dass und mit ihren Rängen identisch sind und dass es keine Bindungen gibt, sodass sie die gleiche Standardabweichung (sagen wir). Wenn wir auch x durch seine Ränge ersetzen, wird das Problem zum äquivalenten Problem für die Pearson-Produkt-Moment-Korrelation. Per Definition der Pearson-Produkt-Moment-Korrelation y 2 σ y ρ ( x , y 1 + y 2 )y1y2σy
ρ1ρ2-

ρ(x,y1+y2)=Cov(x,y1+y2)σxVar(y1+y2)=Cov(x,y1)+Cov(x,y2)σxVar(y1)+Var(y2)+2Cov(y1,y2)=ρ1σxσy+ρ2σxσyσx2σy2+2σy2ρ(y1,y2)=ρ1+ρ22(1+ρ(y1,y2))1/2.
Wenn wir für einen Satz von drei Variablen zwei ihrer drei Korrelationen kennen, können wir die dritte Korrelation begrenzen (siehe z. B. Vos 2009 oder aus der Formel für die Teilkorrelation ):
ρ1ρ21ρ121ρ22ρ(y1,y2)ρ1ρ2+1ρ121ρ22
Daher if ; Wenn , müssen Sie die Grenzen .ρ1+ρ20ρ1+ρ20
ρ1+ρ22(1+ρ1ρ2+1ρ121ρ22)1/2ρ(x,y1+y2)ρ1+ρ22(1+ρ1ρ21ρ121ρ22)1/2
ρ1+ρ20ρ1+ρ20
ein Stop
quelle
Das eigentliche Problem ist jedoch, dass die Ränge nicht hinzugefügt werden. Siehe meinen Kommentar zur Frage.
VQV
@vqv aber wenn und Permutationen der ganzen Zahlen dann sind sie genau die gleichen wie ihre Ränge. y 2 1 ny1y21n
Onestop
Die Hälfte der Summe der Permutationen muss keine Permutation sein. Aber das ist sehr nah und beantwortet die Frage für Pearson, glaube ich.
Shabbychef
Die Rangwerte von sind im Allgemeinen eine nichtlineare Funktion von - selbst wenn und jeweils eine Permutation der ganzen Zahlen . Hier ist ein Beispiel: und . Dann ist und . Zeichnen Sie gegen und Sie werden sehen, dass es keine lineare Beziehung zwischen den beiden gibt. Die obige Behauptung, dass ist, ist im Allgemeinen falsch , selbst unter der Annahme, dassy1+y2y1+y2y1y21,,ny1=(1,2,3,4)y2=(2,3,1,4)y1+y2=(3,5,4,8)y 1 + y 2 r a n k ( y 1 + y 2 ) ρ ( x , y 1 + y 2 ) = C o v ( x , y 1 + y 2 ) /y 1rank(y1+y2)=(1,3,2,4)y1+y2rank(y1+y2)ρ(x,y1+y2)=Cov(x,y1+y2)/ y1und sind Permutationen der ganzen Zahlen. y2
VQV
@vqv Du hast ganz recht. Ich war zu voreilig, um eine Antwort zu versuchen, bevor ich in die Weihnachtspause ging. Ich war noch nie auf diese Ungleichung gestoßen, die die Pearson-Korrelation von drei Variablen betrifft. Hier ist eine weitere Referenz mit 3D-Visualisierungen: jstor.org/stable/2684832 . Ich denke immer noch, dass es eine gewisse Relevanz haben könnte , daher werde ich meine Antwort nicht löschen, obwohl ich auch nicht sehen kann, wie ich sie beheben kann.
Onestop