Woher weiß ich, wann ich zwischen Spearman's und Pearson's wählen soll ? Meine Variable beinhaltet Zufriedenheit und die Bewertungen wurden unter Verwendung der Summe der Bewertungen interpretiert. Diese Punktzahlen könnten jedoch auch eingestuft werden.
119
Antworten:
Wenn Sie Ihre Daten untersuchen möchten, ist es am besten, beide zu berechnen, da die Beziehung zwischen den Korrelationen Spearman (S) und Pearson (P) einige Informationen liefert. Kurz gesagt, S wird in Rängen berechnet und zeigt so monotone Beziehungen, während P in wahren Werten ist und lineare Beziehungen zeigt.
Wenn Sie beispielsweise Folgendes festlegen:
Dies liegt daran, dass mit x monoton zunimmt, sodass die Spearman-Korrelation perfekt, aber nicht linear ist, sodass die Pearson-Korrelation nicht perfekt ist.y X
Es ist interessant, beides zu tun, denn wenn Sie S> P haben, bedeutet dies, dass Sie eine Korrelation haben, die monoton, aber nicht linear ist. Da es gut ist, eine Linearität in der Statistik zu haben (dies ist einfacher), können Sie versuchen, eine Transformation auf (ein solches Protokoll) anzuwenden .y
Ich hoffe, dass dies dazu beiträgt, die Unterschiede zwischen den Korrelationstypen verständlicher zu machen.
quelle
Kürzeste und meist richtige Antwort ist:
Pearson Benchmarks lineare Beziehung, Spearman Benchmarks monotone Beziehung (wenige Unendlichkeiten allgemeiner Fall, aber für einige Kompromisse).
quelle
Dies kommt häufig in der Statistik vor: Es gibt verschiedene Methoden, die in Ihrer Situation angewendet werden können, und Sie wissen nicht, welche Sie wählen sollen. Sie sollten Ihre Entscheidung auf die Vor- und Nachteile der betrachteten Methoden und die Besonderheiten Ihres Problems stützen, aber selbst dann ist die Entscheidung in der Regel subjektiv, ohne dass eine "richtige" Antwort vereinbart wurde. Normalerweise ist es eine gute Idee, so viele Methoden auszuprobieren, wie vernünftig erscheinen und dass Ihre Geduld es zulässt, um zu sehen, welche Ihnen am Ende die besten Ergebnisse bringen.
Der Unterschied zwischen der Pearson-Korrelation und der Spearman-Korrelation besteht darin, dass die Pearson-Korrelation am besten für Messungen auf einer Intervallskala geeignet ist, während die Spearman-Korrelation eher für Messungen auf Ordnungsskalen geeignet ist . Beispiele für Intervallskalen sind "Temperatur in Fahrenheit" und "Länge in Zoll", in denen die einzelnen Einheiten (1 ° F, 1 Zoll) sinnvoll sind. Dinge wie "Zufriedenheitswerte" sind in der Regel ordinaler Art, da klar ist, dass "5 Glück" glücklicher ist als "3 Glück", aber nicht klar ist, ob Sie "1 Glückseinheit" sinnvoll interpretieren können. Aber wenn Sie addieren Bei vielen Messungen des Ordinaltyps, die Sie in Ihrem Fall haben, erhalten Sie eine Messung, die in Wirklichkeit weder ordinal noch intervallbasiert ist und die schwer zu interpretieren ist.
Ich würde empfehlen, dass Sie Ihre Zufriedenheitsbewertungen in Quantilbewertungen umwandeln und dann mit deren Summen arbeiten, da dies Ihnen Daten liefert, die für die Interpretation ein wenig besser geeignet sind. Aber auch in diesem Fall ist nicht klar, ob Pearson oder Spearman angemessener wären.
quelle
Ich bin heute auf einen interessanten Eckfall gestoßen.
Wenn wir eine sehr kleine Anzahl von Proben betrachten, kann der Unterschied zwischen Spearman und Pearson dramatisch sein.
Im folgenden Fall weisen die beiden Methoden eine genau entgegengesetzte Korrelation auf.
Einige schnelle Faustregeln für die Entscheidung zwischen Spearman und Pearson:
ps Hier ist der R-Code, um die obige Grafik zu reproduzieren:
quelle
Ich stimme der Antwort von Charles zu, schlage aber (aus rein praktischen Gründen) vor, beide Koeffizienten zu berechnen und die Unterschiede zu untersuchen. In vielen Fällen sind sie genau gleich, sodass Sie sich keine Sorgen machen müssen.
Wenn sie sich jedoch unterscheiden, müssen Sie prüfen, ob Sie die Annahmen von Pearsons (konstante Varianz und Linearität) erfüllt haben oder nicht. Wenn diese nicht erfüllt sind, ist es wahrscheinlich besser, Spearmans zu verwenden.
quelle