Der Pearson-Koeffizient zwischen zwei Variablen ist ziemlich hoch (r = 0,65). Wenn ich aber die Variablenwerte ordne und eine Spearman-Korrelation durchführe, ist der cofficient-Wert viel niedriger (r = .30).
- Was ist die Interpretation davon?
correlation
spearman-rho
user3671
quelle
quelle
Antworten:
Warum der große Unterschied?
Wenn Ihre Daten normal oder gleichmäßig verteilt sind, würde ich denken, dass die Korrelation zwischen Spearman und Pearson ziemlich ähnlich sein sollte.
Wenn sie sehr unterschiedliche Ergebnisse liefern, wie in Ihrem Fall (.65 versus .30), haben Sie vermutlich Daten oder Ausreißer verzerrt, und Ausreißer führen dazu, dass die Pearson-Korrelation größer ist als die Spearman-Korrelation. Das heißt, sehr hohe Werte für X können mit sehr hohen Werten für Y zusammen auftreten.
Verwandte Fragen
Siehe auch diese vorherigen Fragen zu Unterschieden zwischen der Korrelation von Spearman und Pearson:
Wie wählt man zwischen Pearson- und Spearman-Korrelation?
Pearson- oder Spearman-Korrelation mit nicht normalen Daten
Einfaches R Beispiel
Das Folgende ist eine einfache Simulation, wie dies auftreten könnte. Beachten Sie, dass der folgende Fall einen einzelnen Ausreißer betrifft, Sie jedoch ähnliche Effekte mit mehreren Ausreißern oder verzerrten Daten erzielen können.
Welches gibt diese Ausgabe
Die Korrelationsanalyse zeigt, dass die Korrelation ohne den Ausreißer Spearman und Pearson ziemlich ähnlich ist und mit dem ziemlich extremen Ausreißer ziemlich unterschiedlich ist.
Die folgende Grafik zeigt, wie durch das Behandeln der Daten als Rang der extreme Einfluss des Ausreißers beseitigt wird, sodass Spearman sowohl mit als auch ohne Ausreißer ähnlich ist, während Pearson beim Hinzufügen des Ausreißers ganz anders ist. Dies unterstreicht, warum Spearman oft als robust bezeichnet wird.
quelle