Wilcoxon-Mann-Whitney-kritische Werte in R.

Ich habe festgestellt, dass beim Versuch, die kritischen Werte für Mann-Whitney U mit R zu ermitteln, die Werte immer 1 + kritischer Wert sind. Zum Beispiel ist für der (zweiseitige) kritische Wert 8, während für der ( ) Wert ist ) kritischer Wert ist 22 (siehe Tabellen ), aber: $\alpha=.05, n = 10, m = 5$ $\alpha=.05, n=12, m=8$

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Natürlich denke ich nicht über etwas nach, aber ... könnte mir jemand erklären warum?

r hypothesis-testing nonparametric wilcoxon-mann-whitney this.is.not.a.nick
quelle

Antworten:

Ich denke, die Antwort hier könnte sein, dass Sie Äpfel und Orangen vergleichen.

Es sei das cdf der Mann-Whitney- Statistik. ist die Quantil - Funktion von . Per Definition ist es daher $F(x)$ $U$ qwilcox $Q(\alpha)$ $U$

Q (α) = inf {x \in N : F (x) \geq α}, α \in (0, 1) .

$Q(\alpha)=\inf \{x\in \mathbb{N}: F(x)\geq \alpha\},\qquad \alpha\in(0,1).$

Da diskret ist, gibt es normalerweise kein so dass , also typischerweise . $U$ $x$ $F(x)=\alpha$ $F(Q(\alpha))>\alpha$

Betrachten Sie nun den kritischen Wert für den Test. In diesem Fall möchten Sie , da Sie sonst einen Test mit einer Fehlerrate vom Typ I haben , die größer als die nominelle ist. Dies wird normalerweise als unerwünscht angesehen; konservative Tests werden eher bevorzugt. Daher ist Sofern es kein so dass , haben wir daher . $C(\alpha)$ $F(C(\alpha))\leq \alpha$

C (α) = sup {x \in N : F (x) \leq α}, α \in (0, 1) .

$C(\alpha)=\sup \{x\in \mathbb{N}: F(x)\leq \alpha\},\qquad \alpha\in(0,1).$

x

$x$

F (x) = α

$F(x)=\alpha$

C (α) = Q (α) - 1

$C(\alpha)=Q(\alpha)-1$

Der Grund für die Diskrepanz ist, dass qwilcoxQuantile und keine kritischen Werte berechnet wurden!

MånsT
quelle

(+1) Gute, einfache und präzise Beschreibung. :)

Kardinal

Denken Sie daran, dass die Rang-Summen-Teststatistik diskret ist und Sie daher einen kritischen Wert verwenden müssen, sodass die Endwahrscheinlichkeit zum angegebenen . Für einige Stichprobengrößen gleich Alpha kann nicht erreicht werden, und das ist meine Vermutung, warum Sie die +1 benötigen. $\geq$ $\alpha$

Michael R. Chernick
quelle

Warum wird +1 in R und nicht in den üblichen Tabellen benötigt?

MånsT

@ this.is.not.a.nick: vielleicht noch wichtiger: während , was bedeutet, dass im ersteren Fall das tatsächliche Signifikanzniveau und im letzteren beträgt . Normalerweise neigen Menschen dazu, lieber auf der rechten Seite zu irren, dh ein niedrigeres Signifikanzniveau als das nominelle zu haben (was bedeutet, dass die Werte aus den Tabellen vorzuziehen sind).

0.0236723 < 0.025

$0.0236723<0.025$

0.02868937 > 0.025

$0.02868937>0.025$

< 0.05

$<0.05$

> 0.05

$>0.05$

MånsT

Recht auf Procrastinator und MansT. Tatsächlich erfordert die Definition des Signifikanzniveaus, dass sich die Schwanzwahrscheinlichkeiten nicht zu etwas höher als Alpha summieren. Ich spreche darüber in meiner Arbeit mit Christine Liu über das Sägezahnverhalten der Potenzfunktion für exakte Binomialtests nach der Clopper-Pearson-Methode (siehe American Statistician (2002)).

Michael R. Chernick

@ Michael: Es ist auf der gleichen Seite wie diese. Die Tabellen folgen der Standarddefinition, was bedeutet, dass die kritischen Werte keine Quantile sind.

MånsT

@ Michael: Einverstanden. In gewisser Weise qwilcoxtut es das , was es tun soll, aber nicht das, was Sie erwarten würden.

MånsT