Es ist bekannt, dass die asymptotische relative Effizienz (ARE) des Wilcoxon Signed Rank Test verglichen mit dem Student's t- Test, wenn die Daten aus einer normalverteilten Population stammen. Dies gilt sowohl für den einfachen Test mit einer Stichprobe als auch für die Variante für zwei unabhängige Stichproben (Wilcoxon-Mann-Whitney U). Es ist auch das ARE eines Kruskal-Wallis-Tests im Vergleich zu einem ANOVA F -Test für normale Daten.
Hat dieses bemerkenswerte (für mich eines der " unerwartetsten Erscheinungen von ") und bemerkenswert einfache Ergebnis einen aufschlussreichen, bemerkenswerten oder einfachen Beweis?
Antworten:
Kurze Skizze von ARE für einent Test mit einer Stichprobe , einen signierten Test und einen Test mit signiertem Rang
Ich gehe davon aus, dass die Langversion der Antwort von @ Glen_b eine detaillierte Analyse für einen Rangtest mit zwei Stichproben und eine intuitive Erklärung des ARE enthält. Also werde ich den größten Teil der Ableitung überspringen. (Beispielfall, fehlende Angaben bei Lehmann TSH).
Testaufgabe : SeiX1, … , Xn eine Zufallsstichprobe aus dem Ortsmodell f( x - θ ) , symmetrisch um Null. Wir müssen ARE von vorzeichenbehaftetem Test und vorzeichenbehaftetem Rangtest für die Hypothese H0:θ=0 Bezug auf t-Test berechnen .
Um die relative Effizienz von Tests zu beurteilen, werden nur lokale Alternativen berücksichtigt, da konsistente Tests gegen feste Alternativen gegen 1 tendieren. Lokale Alternativen, die zu einer nichttrivialen asymptotischen Kraft führen, haben häufig die Form für festesh, wasin manchen LiteraturstellenPitman-Drift genannt wird.θn=h/n−−√ h
Unsere vor uns liegende Aufgabe ist
Teststatistik und Asymptotik
Therefore,
Iff is uniform on [-1,1], ARE(Sn)=1/3 , ARE(Wn)=1/3
Remark on the derivation of distribution under the alternative
There are of course many ways to derive the limiting distribution under the alternative. One general approach is to use Le Cam's third lemma. Simplified version of it states
For quadratic mean differentiable densities, local asymptotic normality and contiguity are automatically satisfied, which in turn implies Le Cam lemma. Using this lemma, we only need to computecov(Wn,Δn) under the null. Δn obeys LAN
quelle
This has nothing to do with explaining whyπ appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t -test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t -test is the square of the correlation between the scores used for the two tests. As n→∞ the squared correlation converges to π3 . You can easily see this empirically using R:
quelle
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(which obviously produces the same result)?Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating12σ2[∫f2(x)dx]2 where f is the common density at the null and σ is the common variance.
So at the normal,f2 is effectively a scaled version of f ; its integral will have a 1π√ term; when squared, that's the source of the π .
The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.
For the sign test relative to t, the ARE is4σ2f(0)2 ... and f(0)2 again has a π in it.
So essentially it's as I said in comments;π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.
Reference:
J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.
quelle