In meiner Arbeit vergleichen wir vorhergesagte Rankings mit wahren Rankings für einige Datensätze. Bis vor kurzem haben wir nur Kendall-Tau verwendet. Eine Gruppe, die an einem ähnlichen Projekt arbeitete, schlug vor, stattdessen das Goodman-Kruskal-Gamma zu verwenden und es vorzuziehen. Ich habe mich gefragt, was die Unterschiede zwischen den verschiedenen Rangkorrelationsalgorithmen sind.
Das Beste , was ich gefunden habe, war diese Antwort , die besagt, dass Spearman anstelle der üblichen linearen Korrelationen verwendet wird und dass Kendall-Tau weniger direkt ist und Goodman-Kruskal Gamma ähnlicher ist. Die Daten, mit denen ich arbeite, scheinen keine offensichtlichen linearen Korrelationen zu haben, und die Daten sind stark verzerrt und nicht normal.
Außerdem gibt Spearman im Allgemeinen eine höhere Korrelation als Kendall-Tau für unsere Daten an, und ich habe mich gefragt, was dies speziell über die Daten aussagt. Ich bin kein Statistiker, deshalb erscheinen mir einige der Artikel, die ich über diese Dinge lese, wie Jargon, sorry.
Antworten:
Spearman Rho gegen Kendall Tau . Diese beiden sind rechnerisch so unterschiedlich, dass Sie ihre Größen nicht direkt vergleichen können. Spearman ist normalerweise um 1/4 bis 1/3 höher und dies lässt fälschlicherweise den Schluss zu, dass Spearman für einen bestimmten Datensatz "besser" ist. Der Unterschied zwischen Rho und Tau liegt in ihrer Ideologie, dem Varianzverhältnis für Rho und der Wahrscheinlichkeit für Tau. Rho ist ein gewöhnlicher Pearson R, der für Rangdaten angewendet wird, und wie R ist er empfindlicher für Punkte mit großen Momenten (dh Abweichungen vom Wolkenzentrum) als für Punkte mit kleinen Momenten. Daher ist rho nach dem Ranking sehr empfindlich für die Form der Wolkeerledigt: Der Koeffizient für eine längliche rhombische Wolke ist höher als der Koeffizient für eine längliche Hantelwolke (weil scharfe Kanten der ersten große Momente sind). Tau ist eine Erweiterung von Gamma und ist für alle Datenpunkte gleich empfindlich , so dass es weniger empfindlich für Besonderheiten in der Form der eingestuften Wolke ist. Tau ist "allgemeiner" als Rho, denn Rho ist nur dann gerechtfertigt, wenn Sie der Ansicht sind, dass die zugrunde liegende (modellhafte oder funktionsfähige) Beziehung zwischen den Variablen streng monoton ist. Während Tau nichtmonotone Grundkurven zulässt und misst, welcher monotone "Trend", positiv oder negativ, dort insgesamt vorherrscht. Rho ist in seiner Größe mit r vergleichbar; Tau ist nicht.
Kendall Tau als Gamma . Tau ist nur eine standardisierte Form von Gamma. Einige verwandte Kennzahlen haben alle den Zähler , unterscheiden sich jedoch in der Normalisierung des Nenners :P−Q
wobei - Anzahl der Beobachtungspaare mit "Konkordanz", Q - mit "Inversion"; T x - Anzahl der Bindungen durch Variable X, T y - durch Variable Y, T x y - durch beide Variablen; N - Anzahl der Beobachtungen, k - Anzahl der unterschiedlichen Werte in dieser Variablen, wobei diese Anzahl kleiner ist.P Q Tx Ty Txy N k
Somit ist Tau in Theorie und Größe direkt mit Gamma vergleichbar. Rho ist theoretisch und betragsmäßig direkt mit Pearson . Nick Stauners nette Antwort hier zeigt, wie es möglich ist, Rho und Tau indirekt zu vergleichen.r
Siehe auch über Tau und Rho.
quelle
Hier ist ein Zitat von Andrew Gilpin (1993), der Maurice Kendalls gegenüber Spearmans ρ aus theoretischen Gründen befürwortet :τ ρ
Ich kann nicht viel über Goodman-Kruskal hinzufügen, abgesehen davon , dass es in einer Stichprobe von Umfragedaten, mit denen ich in letzter Zeit gearbeitet habe, deutlich größere Schätzungen als Kendalls τ zu liefern scheint ... und natürlich merklich niedrigere Schätzungen als Spearman's ρ . Allerdings hat ich auch versucht , ein paar Teil Berechnung γ Schätzungen (Foraita & Sobotka, 2012), und diejenigen , kamen näher an den Teil ρ als der Teil τ ... Es dauerte eine ganze Menge an Verarbeitungszeit aber, so werde ich verlassen die Simulationstests oder mathematischen Vergleiche mit jemand anderem ... (wer würde wissen, wie man sie macht ...)γ τ ρ γ ρ τ
Verweise
Foraita, R. & Sobotka, F. (2012). Validierung grafischer Modelle. gmvalid Package, v1.23. Das umfassende R-Archiv-Netzwerk. URL: http://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf
Gilpin, AR (1993). Tabelle zur Umrechnung von Kendall's Tau in Spearman's Rho im Rahmen von Wirkungsgrößen für die Metaanalyse. Educational and Psychological Measurement, 53 (1), 87-92.
Kendall, MG (1962). Rangkorrelationsmethoden (3. Aufl.). London: Griffin.
quelle
quelle
Spearman's ρ is related to the probability of majority concordance among random triplets of observations
genauer erklären , wenn möglich nicht sehr mathematisch? Vielen Dank.