Ich benutze R für die Datenanalyse. R liefert eine corr
Funktion zur Berechnung der Korrelation. Diese Funktion bietet drei verschiedene Ansätze / Algorithmen zur Schätzung der corr
Pearson, Spearman und Kendall. Wann sollte ich jede dieser Methoden anwenden? Welche Faktoren bestimmen, welche Methode angewendet werden soll?
correlation
r
asheeshr
quelle
quelle
Antworten:
Der Produkt-Moment-Koeffizient von Pearson (Pearson-Parameter) misst die lineare Korrelation zwischen Variablen. Daher ist es angebracht, wenn Ihre vermutete Korrelation linear ist, was mit einem Diagramm visuell überprüft werden kann.
Der Kendall-Tau-Koeffizient (Kendall-Parameter) und der Spearman-Korrelationskoeffizient (Spearman-Parameter) sind Maß-Rang-Korrelationen. Die Korrelation zwischen den beiden Variablen muss also nicht linear sein. Die Spearman-Methode ist im Grunde die Pearson-Methode, wird jedoch auf die Ränge der Werte angewendet (der Rang eines Werts wird durch seine Position nach dem Sortieren der Werte angegeben). Die Kendal-Methode wird im Wesentlichen als Statistik in Form einer Ration zwischen der zusätzlichen Anzahl geordneter Paare und der Gesamtzahl der Paare erstellt. Da die Kendal-Methode als Statistik erstellt wird, kann sie auch im Rahmen des Hypothesentests mit allen Vorteilen verwendet werden (sie wird als Tau-Test bezeichnet).
Alle diese Methoden sind Instrumente, mit denen auf die Abhängigkeiten zwischen Zufallsvariablen geschlossen werden kann. Weitere Informationen finden Sie auf der Wikipedia-Seite zu Korrelation und Abhängigkeit
quelle