Wie melden Sie einen Mann-Whitney-Test?

10

Ich mache meine Dissertation und führe eine Reihe von Tests durch. Nach einem Kruskal-Wallis-Test berichte ich das Ergebnis normalerweise folgendermaßen:

Es gibt einen signifikanten Unterschied zwischen den Mitteln von ...(χ(2)2=7.448,p=.024)

Aber jetzt habe ich einen Mann-Whitney-Test durchgeführt und bin mir nicht sicher, welche Werte ich präsentieren soll. SPSS gibt mir einen Mann-Whitney , Wilcoxon , und Wert. Präsentiere ich all diese 4 Werte? Oder sind einige irrelevant?UWZP

Dissertationshilfe
quelle

Antworten:

12

Wikipedia scheint Ihre Antworten zu haben. Hier ist ein Auszug aus der beispielhaften Ergebniserklärung:

Bei der Berichterstattung über die Ergebnisse eines Mann-Whitney-Tests ist Folgendes zu beachten:

  • Ein Maß für die zentralen Tendenzen der beiden Gruppen (Mittelwerte oder Mediane; da der Mann-Whitney-Test ein Ordinaltest ist, werden normalerweise Mediane empfohlen).
  • Der Wert von U.
  • Die Stichprobengrößen
  • Das Signifikanzniveau.

In der Praxis wurden einige dieser Informationen möglicherweise bereits bereitgestellt, und bei der Entscheidung, ob sie wiederholt werden sollen, sollte der gesunde Menschenverstand verwendet werden. Ein typischer Bericht wird möglicherweise ausgeführt.

"Die medianen Latenzen in den Gruppen E und C betrugen 153 und 247 ms; die Verteilungen in den beiden Gruppen unterschieden sich signifikant (Mann-Whitney U = 10,5, n 1 = n 2 = 8, P <0,05 zweiseitig)."

Der Wilcoxon-Signed-Rank-Test ist für gepaarte Proben geeignet, während der Mann-Whitney-Test unabhängige Proben voraussetzt. Laut Field (2000) ist das Wilcoxon in Ihrer SPSS-Ausgabe jedoch "eine andere Version dieser Statistik, die in einen Z-Score umgewandelt und daher mit kritischen Werten der Normalverteilung verglichen werden kann". Das erklärt dann auch deine Punktzahl!Wz

Zu Ihrer Information, Wikipedia fügt hinzu, dass für große Stichproben ungefähr normal verteilt ist. Angesichts all dieser Werte kann man berechnen auch die Effektgröße , die im Falle von Beispiel Wikipedias ist 0,319 (ein Rechner in Abschnitt implementiert ist 11 hier ). Diese Transformation der Teststatistik hängt jedoch von der ungefähren Normalität von , sodass sie mit n s = 8 möglicherweise ungenau ist ( Fritz et al., 2012 ) .Uη2U

PS Die Ergebnisse des Kruskal-Wallis-Tests sollten nur unter besonderen Umständen so interpretiert werden, dass sie Unterschiede zwischen den Mitteln aufdecken. Weitere Informationen finden Sie in der Antwort von @ Glen_b auf eine andere Frage, "Unterschied zwischen ANOVA- und Kruskal-Wallis-Test" .

Verweise

Field, A. (2000). 3.1. Mann-Whitney-Test. Forschungsmethoden 1: SPSS für Windows Teil 3: Nichtparametrische Tests. Abgerufen von http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE & Richler, JJ (2012). Schätzungen der Effektgröße: aktuelle Verwendung, Berechnungen und Interpretation. Journal of Experimental Psychology: General , 141 (1), 2–18. PDF über ResearchGate verfügbar .

Nick Stauner
quelle
3
Was bringt es, den Wert von U im obigen Beispiel zu melden? Was kann ich als Leser davon haben, dass U 10,5 war?
Amöbe sagt Reinstate Monica
4
Im obigen Beispiel erhalten Sie die Möglichkeit, das genaue zu berechnen , das nicht angegeben ist und für die Schätzung der Effektgröße, die Metaanalyse oder die Überprüfung auf Hacking nützlich sein kann. Ein Freund und Kollege von mir, @rpierce, hat mir auch geraten, Teststatistiken zu melden, um den Lesern sicherzustellen, dass ich die Dinge im Allgemeinen richtig mache, da er viele veröffentlichte Artikel über falsch gemeldete Teststatistiken und zugehörige falsch gemacht hat . ppdf
Nick Stauner
Interessant. Ich denke, dieses Problem könnte eine separate Frage wert sein, die ich hier irgendwann stellen könnte. Dennoch: Wenn man genaue p-Werte will, kann man genaue p-Werte melden! In der Tat ist der übliche Rat, genaue p-Werte anzugeben, es sei denn, sie sind sehr klein, wie p <0,0001; In diesem Fall ist P-Hacking jedoch unwahrscheinlich. Die Effektgröße sollte ohnehin separat angegeben werden, z. B. "Die mittleren Latenzen in den Gruppen E und C betrugen 153 und 247 ms" in Ihrem Zitat aus dem Wiki.
Amöbe sagt Reinstate Monica
1
Geheime (dh nicht durchsuchbare) Facebook-Gruppe für die Psychologen unserer Alma Mater; Keine Beispiele enthalten. Ich bin aber auch neugierig. Vielleicht können Sie ihn dazu bringen, einige zu teilen, wenn Sie ihn in einer separaten Frage markieren :) Ich wette, andere hier hätten auch viele Beispiele, mit denen sie sich einmischen könnten - das heißt, wenn die Frage nicht als irgendwie nicht zum Thema gehörend geschlossen wird ! Sicherlich eine grundlegendere Frage wie: "Warum ist es wichtig, zusätzlich zu und der Effektgröße Teststatistiken zu melden ?" Ich denke, es wäre ein Thema, aber zuerst nach Duplikaten unter dem Reporting- Tag p
Nick Stauner
1
Wenn die Stichprobengrößen nicht so klein sind, dass sie falsch interpretiert werden, würde ich ein standardisiertes U oder W (standardisiert, sie sind identisch) als Z-Wert ( B. angeben, da die Leser einen intuitiven Sinn haben von dem, was das bedeutet - obwohl es dann notwendig wird, klar zu sein, wenn Sie den genauen p-Wert haben, wenn Sie dies tun, nicht einen, der auf dem Z-Wert für die Statistik basiert. ZU
Glen_b -State Monica