Bound den Unterschied zwischen Spearman's Correlation und Kendall's Correlation

9

Ich versuche zu beweisen oder zu widerlegen, dass der Unterschied zwischen Spearmans Korrelation und Kendalls Korrelation nicht mehr als 1 beträgt (oder weniger, je enger desto besser).

Ich gehe davon aus, dass es keine Bindungen gibt.

Um das Ergebnis anhand eines Zählerbeispiels zu widerlegen, habe ich alle Möglichkeiten für Vektoren mit der Länge 8 überprüft. Ich habe einige hübsche Bilder, aber kein Zählerbeispiel:

Unterschied:

Der Unterschied beträgt in diesem Fall nie mehr als 0,4, daher denke ich, dass es wahr ist, aber ich konnte es nicht beweisen.

Pqqwetiqe
quelle
1
Es gibt einen sehr interessanten Beitrag, der eine teilweise Kopie Ihrer Frage sein könnte. Es ist "Kendall Tau oder Spearman's Rho? Stats.stackexchange.com/questions/3943/kendall-tau-or-spearmans-rho.
Michael R. Chernick
1
Für diejenigen, die einen direkten algebraischen Ansatz verfolgen möchten, glaube ich, dass das Ergebnis in zwei Schritten erzielt werden kann. Zeigen Sie zunächst (der Schlüsselschritt), dass der extreme Absolutwert der Differenz für die Daten Punkte für Punkte und Punkte Punkte für Punkte. Berechnen Sie dann einfach die Unterschiede für diese Datensätze. (Im ersten Fall gibt es ein anderes Maximum und im zweiten Fall gibt es drei andere Maxima, die durch offensichtliche Symmetrien impliziert werden.)
(1,n),(2,n1),,(n,1),(n+1,2n),(n+2,2n1),,(2n,n+1)
2n
(1,n+1),(2,n),,(n+1,1),(n+2,2n+1),(n+3,2n),,(2n+1,n+2)
2n+1
whuber
2
@Glen_b Wenn ich bin richtig, dann ist die maximale absolute Differenz für Daten mit einer Länge ist der einen Grenzwert von (von unten) alsDas unterstützt, was Sie geschrieben haben. Diese Formel bezieht sich auf A111384 , dessen Werte durch . n
2(n2)n2n2n(n21),
1/2n.n(n21)/4
whuber
1
Diese Grenze scheint mit Ihrer Formel für gerade n übereinzustimmen (und Ihre Grenzfälle im vorherigen Kommentar scheinen sicherlich mit denen übereinzustimmen, die durch erschöpfende Berechnung für alle kleinen Werte erhalten wurden, die ich leicht überprüfen konnte - aber ich gehe davon aus, dass Sie dies bereits getan haben). Es ist interessant, dass die Grenze 1/2 ist. Habe ich im ungeraden Fall einen Fehler gemacht? (Bearbeiten: Nein, ich n
verstehe
2
@Glen_b Eine Grenze von ist intuitiv: Für die von mir beschriebenen Muster liegt Spearman nahe bei während Kendall . Die Algebra wird vereinfacht, indem ich meinen "Crayon" -Ansatz zur Kovarianz verallgemeinere. Hier ist Code, der die relevanten Formeln implementiert. Die Argumente bestehen aus zwei Permutationen von . Spearman : Kendall :1/21/2O(1/n)R1:nfunction(x, y) mean(outer(x, x, '-') * outer(y, y, '-')) * 6 / (length(x)^2 - 1) function(x,y) mean(sign(outer(x, x, '-')) * sign(outer(y, y, '-'))) * (1 + 1/(length(x)-1))
whuber

Antworten:

0

Vielleicht möchten Sie sich dieses Papier ansehen ! Und andere Werke dieser Autoren. Ich kann mich nicht genau erinnern, wo, aber ich habe Ihre erste Grafik in ihren Papieren und einige Beweise dazu gesehen. Ich denke, dies kann durch die Nutzung von Copulas erreicht werden (da Kendall Tau und Spearman Rho als Funktion der zugrunde liegenden Copula zwischen den beiden Variablen geschrieben werden können). Ich hoffe es hilft.

C ist die Kopula von .(X,Y)

τ(X,Y)=40101C(u,v)c(u,v)dudv1

(Kendall-Korrelation ist die Erwartung der in skalierten Kopula )[0,1]

ρ(X,Y)=120101C(u,v)dudv3

Dann|τρ|

mic
quelle
2
Das Papier ist eine schöne Referenz für die Techniken, die es zeigt. Es scheint jedoch kein Ergebnis zu enthalten, das leicht das in dieser Frage vermutete implizieren würde. Dies liegt vor allem daran, dass die Ergebnisse nicht universell sind: Sie gelten unter verschiedenen restriktiven Bedingungen und selbst dann nur im Grenzbereich, wenn sich die gemeinsame Verteilung der Unabhängigkeit nähert.
whuber