Was ist der Unterschied zwischen wilcox.test und coin :: wilcox_test in R?

13

Diese beiden Funktionen existieren in R, aber ich kenne ihre Unterschiede nicht. Es scheint, dass sie nur dieselben p-Werte zurückgeben, wenn sie wilcox.testmit correct=FALSEund wilcox_test(im Münzpaket) mit aufrufen distribution="aymptotic". Für andere Werte geben sie andere p-Werte zurück. Gibt außerdem wilcox.testimmer W = 0 für meinen Datensatz zurück, unabhängig von den Einstellungen seiner Parameter:

x = c(1, 1, 1, 3, 3, 3, 3) und y = c(4, 4, 6, 7, 7, 8, 10)

Wenn ich versuche, andere Tools als R zu verwenden (einige online verfügbar, andere als Excel-Add-Ons), werden manchmal unterschiedliche p-Werte gemeldet.

Woher kann ich also wissen, welches Tool den "richtigen" p-Wert liefert?

Gibt es einen "richtigen" p-Wert oder sollte ich glücklich sein, wenn einige Werkzeuge einen p-Wert <0,05 angeben? (Manchmal bieten diese Tools nicht so viele Parametrisierungsmöglichkeiten wie R.)

Was vermisse ich hier?

mljrg
quelle

Antworten:

18

Den Schlüssel zu Ihrer Frage finden Sie in? Wilcox.test im Abschnitt Notizen:

Die Literatur ist sich nicht einig über die Definitionen der Wilcoxon-Rangsumme und der Mann-Whitney-Tests.

Das bedeutet, dass es mehr als eine Möglichkeit gibt, diesen nicht parametrischen Test der Positionsänderung zwischen zwei Proben durchzuführen. Darüber hinaus gibt es bei jeder Definition mehr als einen Weg, um einen p-Wert zu erhalten. "genau" bedeutet, dass es absolut richtig ist, während "ungefähr" oder "asymptotisch" beide Annäherungen an die Wahrheit sind. Deshalb gibt es in beiden wilcox.test()und mehrere Optionen wilcox_test(), von denen nur einige genau übereinstimmen - wenn beide Funktionen genau dasselbe tun. Es sieht so aus, als ob wilcox_test()man auch bei gebundenen Werten genaue p-Werte erhalten kann, während man bei gebundenen Werten wilcox.test()auf eine asymptotische Näherung zurückfällt. Ich würde nicht wissen, welche Kombination von statistischen und p-Wert-Berechnungen ein Excel-Add-On macht,

Ihre nächste Frage ist, warum wilcox.test()immer 0 zurückgegeben wird. Für den von Ihnen erstellten Datensatz ist der Wert der Teststatistik 0, wenn Sie wilcox.test (x, y) ausführen, aber 49, wenn Sie wilcox.test (y, x) ausführen, obwohl der p-Wert der Wert ist gleich. Siehe die Wikipedia-Seite für die Gründe. wilcox_test()gibt eine Z-Transformation der Statistik zurück wilcox.test(), die von zurückgegeben wird, weshalb sie unterschiedliche Werte der Teststatistik haben.

Gibt es einen korrekten p-Wert? Ja, aber manchmal ist es zu schwierig zu berechnen, und deshalb müssen wir ungefähre Methoden verwenden (siehe? Wilcox_test für Beschreibungen, wie die genaue Berechnung aufgrund unzureichenden Speichers fehlschlagen kann). Die Unterschiede zwischen Annäherung und genauem Wert sind meistens unwichtig, es sei denn, der wahre Unterschied in der Position der beiden Gruppen ist sehr gering.

atiretoo - monica wieder einsetzen
quelle
(+1) Willkommen auf unserer Website, Drew!
whuber