Der Mann-Whitney-Test ist ein Sonderfall eines Permutationstests (die Verteilung unter der Null wird abgeleitet, indem alle möglichen Permutationen der Daten betrachtet werden), und Permutationstests haben die Null als identische Verteilungen, so dass dies technisch korrekt ist.
Eine Denkweise der Mann-Whitney-Teststatistik ist ein Maß dafür, wie oft ein zufällig ausgewählter Wert aus einer Gruppe einen zufällig ausgewählten Wert aus der anderen Gruppe überschreitet. Daher ist auch P (X> Y) = 0,5 sinnvoll, und dies ist technisch eine Eigenschaft der Gleichverteilungen Null (unter der Annahme kontinuierlicher Verteilungen, bei denen die Wahrscheinlichkeit eines Gleichstands 0 ist). Wenn die beiden Verteilungen gleich sind, beträgt die Wahrscheinlichkeit, dass X größer als Y ist, 0,5, da beide aus derselben Verteilung stammen.
Der angegebene Fall von 2 Verteilungen mit demselben Mittelwert, aber stark unterschiedlichen Varianzen stimmt mit der 2. Nullhypothese überein, jedoch nicht mit der 1. identischen Verteilung. Wir können einige Simulationen durchführen, um zu sehen, was in diesem Fall mit den p-Werten passiert (theoretisch sollten sie gleichmäßig verteilt sein):
> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )
1-sample proportions test with continuity correction
data: sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
0.07824054 0.08161183
sample estimates:
p
0.07991
Dies wird also eindeutig häufiger abgelehnt als es sollte, und die Nullhypothese ist falsch (dies entspricht der Verteilungsgleichheit, aber nicht prob = 0,5).
Das Denken in Bezug auf die Wahrscheinlichkeit von X> Y stößt auch auf einige interessante Probleme, wenn Sie jemals Populationen vergleichen, die auf Efrons Würfeln basieren .
Mann-Whitney reagiert nicht empfindlich auf Varianzänderungen mit gleichem Mittelwert, kann jedoch - wie Sie bei der Form - Unterschiede erkennen, die dazu führen, dass von abweicht (z wo sowohl Mittelwert als auch Varianz zusammen zunehmen). Ganz klar, wenn Sie zwei Normalen mit gleichem Mittelwert hatten, sind ihre Unterschiede symmetrisch um Null. Daher ist , was die Nullsituation ist.P ( X > Y ) 0,5 P ( X > Y ) = P ( X - Y > 0 ) = 1P(X>Y)=0.5 P(X>Y) 0.5 P(X>Y)=P(X−Y>0)=12
Wenn zum Beispiel die Verteilung von exponentiell mit dem Mittelwert während eine exponentielle Verteilung mit dem Mittelwert (eine Skalenänderung), ist der Mann-Whitney dafür empfindlich (in der Tat, wenn er Protokolle von beiden Seiten nimmt, ist es nur a Ortsverschiebung, und das Mann-Whitney bleibt von der monotonen Transformation unberührt.1 X kY 1 X k
- -
Wenn Sie an Tests interessiert sind, die dem Mann-Whitney konzeptionell sehr ähnlich sind und die auf Unterschiede in der Streuung unter Gleichheit der Mediane reagieren , gibt es mehrere solcher Tests.
Es gibt zum Beispiel den Siegel-Tukey- Test und den Ansari-Bradley-Test, die beide eng mit dem Mann-Whitney-Wilcoxon-Test mit zwei Stichproben verwandt sind.
Sie basieren beide auf der Grundidee, von Anfang an einzusteigen.
Wenn Sie R verwenden, ist der Ansari-Bradley-Test in ...
?ansari.test
Der Siegel-Tukey führt tatsächlich nur einen Mann-Whitney-Wilcoxon-Test an Rängen durch, die aus der Stichprobe unterschiedlich berechnet wurden. Wenn Sie die Daten selbst bewerten, benötigen Sie keine separate Funktion für die p-Werte. Trotzdem finden Sie einige, wie hier:
http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/
- -
(in Bezug auf den Kommentar von ttnphns unter meiner ursprünglichen Antwort)
Sie würden meine Antwort überinterpretieren, um sie als nicht einverstanden mit @GregSnow in einem besonders inhaltlichen Sinne zu lesen. Es gibt sicherlich einen Unterschied in der Betonung und in gewissem Maße in dem, worüber wir sprechen, aber ich wäre sehr überrascht, wenn dahinter wirklich echte Meinungsverschiedenheiten stecken würden.
Lassen Sie uns Zitat Mann und Whitney: „Eine Statistik in Abhängigkeit von den relativen Ränge der 's und ist vorgeschlagen zum Testen der Hypothese . “ Das ist eindeutig; es unterstützt die Position von @ GregSnow voll und ganz.x y f = gU x y f=g
Lassen Sie uns nun sehen, wie die Statistik aufgebaut ist: " Lassen Sie zählen, wie oft ein vor einem .y xU y x " Wenn nun ihre Null wahr ist, ist die Wahrscheinlichkeit dieses Ereignisses ... aber Es gibt andere Möglichkeiten, eine Wahrscheinlichkeit von 0,5 zu erhalten, und in diesem Sinne könnte man annehmen, dass der Test unter anderen Umständen funktionieren kann. In dem Maße, in dem sie eine (neu skalierte) Wahrscheinlichkeit schätzen, dass > , unterstützt es das, was ich gesagt habe.1 YX.12 Y X
Damit jedoch garantiert wird, dass die Signifikanzniveaus genau korrekt sind, muss die Verteilung von mit der Nullverteilung übereinstimmen. Dies basiert auf der Annahme, dass alle Permutationen der und Gruppenmarkierungsmarkierungen zu den kombinierten Beobachtungen unter der Null gleich wahrscheinlich waren. Dies ist sicherlich unter der Fall . Genau wie @GregSnow sagte.X Y f = gU X Y f=g
Die Frage ist, inwieweit dies der Fall ist (dh dass die Verteilung der Teststatistik mit derjenigen übereinstimmt, die unter der Annahme abgeleitet wurde, dass , oder ungefähr so), für die allgemeiner ausgedrückte Null.f=g
Ich glaube, dass es in vielen Situationen so ist; Insbesondere für Situationen, die allgemeiner sind als die von Ihnen beschriebene (zwei normale Populationen mit demselben Mittelwert, aber extrem ungleicher Varianz können ziemlich stark verallgemeinert werden, ohne die resultierende Verteilung basierend auf den Rängen zu ändern), glaube ich, dass die Verteilung der Teststatistik Es stellt sich heraus, dass es dieselbe Verteilung hat, unter der es abgeleitet wurde, und daher dort gültig sein sollte. Ich habe einige Simulationen durchgeführt, die dies zu unterstützen scheinen. Es wird jedoch nicht immer ein sehr nützlicher Test sein (es kann eine schlechte Leistung haben).
Ich biete keinen Beweis dafür, dass dies der Fall ist. Ich habe einige Intuitions- / Handwellenargumente angewendet und auch einige grundlegende Simulationen durchgeführt, die darauf hindeuten, dass es wahr ist - dass Mann-Whitney (da es die 'richtige' Verteilung unter der Null hat) viel breiter funktioniert als wenn .f=g
Machen Sie daraus, was Sie wollen, aber ich verstehe dies nicht als wesentliche Meinungsverschiedenheit mit @GregSnow
Referenz - Originalpapier von Mann & Whitney
quelle
the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation
. Und so stimmen Sie der Antwort von @ Greg nicht zu, oder?