Anscheinend ist Pearsons Korrelationskoeffizient parametrisch und Spearmans Rho nicht parametrisch.
Ich habe Probleme, das zu verstehen. So wie ich es verstehe, wird Pearson berechnet als und Spearman wird auf die gleiche Weise berechnet, außer dass wir alle Werte durch ihre Ränge ersetzen.
Wikipedia sagt
Der Unterschied zwischen dem parametrischen Modell und dem nicht parametrischen Modell besteht darin, dass das erstere eine feste Anzahl von Parametern aufweist, während das letztere die Anzahl der Parameter mit der Menge der Trainingsdaten erhöht.
Aber ich sehe keine Parameter außer den Beispielen selbst. Einige sagen , dass parametrische Tests Normalverteilungen übernehmen und weitergehen zu sagen , dass Pearson normalverteilte Daten übernimmt, aber ich sehe nicht , warum Pearson , dass erfordern würde.
Meine Frage ist also, was parametrisch und nicht parametrisch im Kontext der Statistik bedeutet. Und wie passen Pearson und Spearman dort hinein?
quelle
Antworten:
Das Problem ist, dass "nichtparametrisch" heutzutage zwei unterschiedliche Bedeutungen hat. Die Definition in Wikipedia gilt für Dinge wie nichtparametrische Kurvenanpassung, z. B. über Splines oder lokale Regression. Die andere Bedeutung, die älter ist, ist eher im Sinne von "verteilungsfrei" - dh Techniken, die unabhängig von der angenommenen Verteilung der Daten angewendet werden können. Letzteres gilt für Spearmans Rho, da die Rangtransformation impliziert, dass es unabhängig von Ihrer ursprünglichen Verteilung dasselbe Ergebnis liefert.
quelle
Ich denke, der einzige Grund, warum Pearsons Korrelationskoeffizient als parametrisch bezeichnet wird, besteht darin, dass Sie ihn zur Schätzung der Parameter der multivariaten Normalverteilung verwenden können. Beispielsweise hat die bivariate Normalverteilung 5 Parameter: zwei Mittelwerte, zwei Varianzen und den Korrelationskoeffizienten. Letzteres kann mit dem Pearson-Korrelationskoeffizienten abgeschätzt werden.
quelle
Die einfachste Antwort, denke ich, ist, dass Spearmens Rho-Test Ordnungsdaten verwendet (Zahlen, die eingestuft werden können, aber nichts über das Intervall zwischen den Zahlen aussagen, z. B. 3 Eissorten, werden mit 1, 2 und 3 eingestuft, aber dies sagt Ihnen nur, welche Geschmack wurde nicht bevorzugt, wie viel von). Ordnungsdaten können nicht in parametrischen Tests verwendet werden.
Pearsons r-Test verwendet Intervall- oder Verhältnisdaten (Zahlen mit festen Intervallen, z. B. Sekunden, kg, mm). 1mm ist nicht nur kleiner als 5mm, sondern Sie wissen genau, wie viel von. Diese Art von Daten kann in einem parametrischen Test verwendet werden.
quelle