Mann-Whitney-U-Test: Konfidenzintervall für die Effektgröße

13

Nach Fritz, Morris und Richler (2011; siehe unten), unter Verwendung der Formel kann als eine Effektgröße für den Mann-Whitney - U-Tests berechnet werden Dies ist bequem, ich, wie ich auch bei anderen gelegenheiten berichte. Ich möchte das Konfidenzintervall für zusätzlich zum Effektgrößenmaß angeben.r rr

r=zN
rr

Hier sind meine Fragen :

  • Kann ich die Konfidenzintervalle für r wie für Pearson's r berechnen, obwohl es als Maß für die Effektgröße für einen nichtparametrischen Test verwendet wird?
  • Welche Konfidenzintervalle müssen für einseitige oder zweiseitige Tests angegeben werden?

Änderung zur zweiten Frage: "Welche Konfidenzintervalle müssen für einseitige oder zweiseitige Tests angegeben werden?"

Ich habe weitere Informationen gefunden, die meiner Meinung nach diese Frage beantworten können. "Während zweiseitige Konfidenzgrenzen ein Konfidenzintervall bilden, werden ihre einseitigen Gegenstücke als untere oder obere Konfidenzgrenzen bezeichnet." ( http://en.wikipedia.org/wiki/Confidence_interval ). Aus diesen Informationen schließe ich, dass es nicht das Hauptproblem ist, ob der Signifikanztest (z. B. Test ) ein- oder zweiseitig war, sondern welche Informationen man in Bezug auf das CI für die Effektgröße interessiert. Mein Fazit (bitte korrigieren Sie mich, wenn Sie nicht einverstanden sind):t

  • zweiseitiger CI an oberen und unteren Grenzen interessiert ist (infolgedessen ist es möglich, dass ein zweiseitiger CI 0 ergibt, obwohl der einseitige Signifikanztest p <.05 war, insbesondere wenn der Wert nahe war .05.)
  • einseitiges "CI" interessiert sich nur für die obere oder untere Schranke (aus theoretischen Gründen); Dies ist jedoch nicht unbedingt die Hauptinteressensfrage nach dem Testen einer gerichteten Hypothese. Ein zweiseitiges CI ist perfekt geeignet, wenn der Fokus auf dem möglichen Bereich einer Effektgröße liegt. Richtig?

Siehe unten für die Textpassage von Fritz, Morris & Richler (2011) zur Schätzung der Effektgrößen für den Mann-Whitney-Test aus dem Artikel, auf den ich mich oben beziehe.

Die meisten der hier beschriebenen Effektgrößenschätzungen gehen von einer Normalverteilung der Daten aus. Einige Daten erfüllen jedoch nicht die Anforderungen für parametrische Tests, z. B. Daten auf einer Ordnungszahl, aber nicht auf einer Intervallskala Verwenden Sie in der Regel nichtparametrische statistische Tests wie den Mann-Whitney- und den Wilcoxon-Test. Die Signifikanz dieser Tests wird in der Regel durch die Annäherung der Verteilungen der Teststatistik an die Verteilung bei nicht zu kleinen Stichprobengrößen und durch statistische Tests bewertet Pakete, wie SPSS, dass diese Tests berichten über den entsprechenden laufen - Wert zusätzlich zu den Werten für oder ;zzUTzkann auch von Hand berechnet werden (z. B. Siegel & Castellan, 1988). Der Wert kann verwendet werden, um eine Effektgröße zu berechnen, wie das von Cohen (1988) vorgeschlagene ; Cohens Richtlinien für r besagen, dass ein großer Effekt .5, ein mittlerer Effekt .3 und ein kleiner Effekt .1 ist (Coolican, 2009, S. 395). Es ist leicht zu berechnen , oder von diesen - Werten , da und zrrr2η2z

r=zN
r2orη2=z2N
Diese Effektgrößenschätzungen bleiben trotz des Vorhandenseins von N in den Formeln unabhängig von der Probengröße. Dies liegt daran, dass z empfindlich auf die Stichprobengröße reagiert. Durch Teilen durch eine Funktion von N wird der Effekt der Stichprobengröße aus der resultierenden Effektgrößenschätzung entfernt. "(S. 12)
grau
quelle
Das Papier ist hier kostenlos erhältlich .
Asac

Antworten:

9

Eine Auswahl der Effektgröße für den Mann-Whitney-U-Test ist die gemeinsame Effektgröße. Für das Mann-Whitney-U ist dies der Anteil der Stichprobenpaare, der eine angegebene Hypothese stützt.

Eine zweite Wahl ist die Rangkorrelation; Da die Rangkorrelation von -1 bis +1 reicht, weist sie ähnliche Eigenschaften wie Pearson r auf. Darüber hinaus ist die Rangkorrelation nach der einfachen Differenzformel der Unterschied zwischen der Größe des gemeinsamen Spracheffekts und seinem Komplement, eine Tatsache, die die Interpretation fördert. Wenn beispielsweise 100 Stichprobenpaare vorhanden sind und 70 Stichprobenpaare die Hypothese stützen, beträgt die gemeinsame Spracheffektgröße 70% und die Rangkorrelation ist r = 0,70 = 0,30 = 0,40. Eine klare Diskussion der gemeinsamen Spracheffektgröße und der vier Formeln zur Berechnung der Rangkorrelation gibt Kerby in der Zeitschrift Innovative Teaching: Kerby (2014) Innovative Teaching

Übrigens, obwohl das Papier es nicht erwähnt, bin ich ziemlich sicher, dass Somers d und die Rangkorrelation für den Mann-Whitney gleichwertig sind.

DSK
quelle
1
Meinen Sie "Zum Beispiel, wenn es 100 mögliche Paare gibt"? Der Mann-Whitney-U-Test bezieht sich auf ungepaarte Daten, daher ist die Formulierung nicht eindeutig. Sie möchten dem Leser möglicherweise erläutern, welche Paare möglich sind.
gung - Wiedereinsetzung von Monica
1
Vielen Dank für den Kommentar und die Möglichkeit zur Klärung. Ich bezog mich auf Stichprobenpaare . Wenn die experimentelle Probe 10 Beobachtungen enthält und wenn die Kontrollprobe 10 Beobachtungen enthält, gibt es 10 · 10 = 100 Probenpaare . Laut Robert Grissom ist die Effektgröße der Stichprobe ein unvoreingenommener Schätzer der Populationseffektgröße. Wenn also die Rangkorrelation für die Stichprobe r = 0,40 ist, ist dies ein unverzerrter Schätzer der Populationswirkungsgröße.
DSK
Ich habe vermutet, dass Sie das gemeint haben, @DSK. Ich denke, diese Erklärung wird den Menschen helfen. Vielleicht möchten Sie das in Ihrer Antwort bearbeiten. Willkommen zum Lebenslauf.
gung - Reinstate Monica
8

Ihr Link führt mich zu einer Möglichkeit, den Artikel zu kaufen.

cHmiscrcorr.censcDxyDxy=2×(c12)

Frank Harrell
quelle
Vielen Dank, dass Sie mich darauf aufmerksam gemacht haben (Link). Ich habe jetzt die Passage zum Mann-Whitney-Test in meine Frage eingefügt.
Grau
Ich danke Ihnen sehr für Ihre Antwort. Haben Sie möglicherweise einen Link zur Interpretation des C-Index und von Somers 'D parat? Mich würde besonders interessieren, ob letzteres vergleichbar mit r interpretiert werden kann. Ich habe zwei Stichproben und in der zweiten Stichprobe (größere N und Normalverteilung) melde ich r. Ich denke, es würde den Vergleich der Ergebnisse erleichtern, wenn die verwendeten Maßnahmen ähnlich wären - so weit wie möglich natürlich. Aus diesem Grund interessierte mich die von Fritz et al. (2011). Also kann der CI für ihr r nicht wie für Pearsons r berechnet werden, was ich annehme? Vielen Dank nochmal!
grau
zDxyYDc
Vielen Dank für deine Antwort. Ich suchte nach weiteren Informationen zur Interpretation von Somer, war aber bisher nicht sehr erfolgreich. Kann man Somers d ähnlich wie den Pearsonschen Korrelationskoeffizienten verstehen, z. B. liefert das Quadrieren einen Bestimmungskoeffizienten? Ich würde mich sehr freuen, ein Maß für die Effektgröße zu finden, das ähnlich wie r interpretiert werden kann, falls eines existiert.
grau
Zu der Formel r = Z / √ (N) habe ich weitere Informationen gefunden: Rosenthal (1991) schreibt: "Wir können eine Effektgröße r sinnvollerweise nur ausgehend von der ap-Ebene abschätzen, solange wir die Größe der Studie kennen (N). Wir konvertieren das erhaltene p in sein normales Abweichungsäquivalent unter Verwendung einer Tabelle von Z-Werten. "
grau