Leistungsanalyse für Kruskal-Wallis- oder Mann-Whitney-U-Test mit R?

Es ist sicherlich möglich, die Leistung zu berechnen.

Genauer gesagt: Wenn Sie ausreichende Annahmen treffen, um eine Situation zu erhalten, in der Sie (in gewisser Weise) die Wahrscheinlichkeit einer Zurückweisung berechnen können, können Sie die Leistung berechnen.

Wenn Sie im Wilcoxon-Mann-Whitney (zum Beispiel) die Verteilungsformen annehmen (eine Annahme über die Verteilungsform (en) machen) und eine Annahme über die Skalen (Spreads) und spezifischen Werte der Standorte oder Unterschiede in den Standorten machen Ist es möglich, dass Sie die Potenz entweder algebraisch oder über numerische Integration berechnen können? andernfalls können Sie die Ablehnungsrate simulieren.

Zum Beispiel, wenn wir von einer Stichprobe ab $t_5$ Verteilungen mit einer festgelegten (standardisiert für eine gemeinsame Skala), könnten wir angesichts der Stichprobengröße viele Datensätze simulieren, die all diese Bedingungen erfüllen, und so eine Schätzung der Ablehnungsrate erhalten. wir also an, wir haben zwei Stichproben von Verteilungen ( ) mit Einheitenskala ( ) - ohne Verlust der Allgemeinheit - und mit . Auch hier könnten wir ohne Verlust der Allgemeinheit . Dann können wir für eine bestimmte Stichprobengröße - (sagen wir) - die Beobachtungen und damit die Potenz für diesen bestimmten Wert von simulieren. $t_5$ $\sigma=1$ $\delta=\mu_2-\mu_1=1$ $\mu_1=0$ $n_1=6,n_2=9$ (dh ). Hier ist ein kurzes Beispiel in R: $\delta/\sigma$ $1$

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

Drei derartige Simulationen ergaben Ausschussraten von 0,321, 0,321 und 0,316; Die Leistung liegt anscheinend in der Nähe von 0,32 (Sie können ein Konfidenzintervall aus nur einer dieser Simulationen berechnen, da die Anzahl der Zurückweisungen binomisch ist ). In der Praxis verwende ich tendenziell größere Simulationen, aber wenn Sie viele verschiedene oder simulieren, möchten Sie möglicherweise nicht mehr als 10000 Simulationen für jede einzelne durchführen. $n$ $\delta$

Wenn Sie dies für viele Werte der Ortsverschiebung tun, können Sie sogar eine Leistungskurve für diese Reihe von Umständen erhalten, wenn sich die Ortsverschiebung ändert, wenn Sie dies wünschen.

$n_1$ $n_2$ $\sigma^2$ $\delta/\sigma$ $\delta$ $n$ $n$ $1-b_i$ $\delta=\delta_i$ $\Phi^{-1}(1-b)$ $\delta$ $\delta$ $\delta$ $n$ $\delta$

$P(Y_2>Y_1)$

Beachten Sie, dass diese Tests zwar verteilungsfrei sind (für kontinuierliche Verteilungen), das Verhalten jedoch unter verschiedenen Verteilungsannahmen für die Alternativen unterschiedlich ist.

Die Situation für das Kruskal-Wallis ist ähnlich, aber Sie müssen mehr Ortsverschiebungen (oder eine andere Situation, die Sie sich ansehen) angeben.

Das Diagramm in dieser Antwort zeigt einen Vergleich einer Leistungskurve für einen gepaarten t-Test mit einer simulierten Leistung für einen vorzeichenbehafteten Rangtest bei einer bestimmten Stichprobengröße über eine Vielzahl standardisierter Ortsverschiebungen für die Stichprobe aus Normalverteilungen mit einer angegebenen Korrelation zwischen Paaren. Ähnliche Berechnungen können für das Mann-Whitney und das Kruskal-Wallis durchgeführt werden.

Glen_b - Setzen Sie Monica wieder ein
quelle

Leistungsanalyse für Kruskal-Wallis- oder Mann-Whitney-U-Test mit R?

Antworten: