Nach einigen Diskussionen (unten) habe ich jetzt ein klareres Bild einer fokussierten Frage. Hier ist eine überarbeitete Frage, obwohl einige der Kommentare jetzt möglicherweise nicht mit der ursprünglichen Frage verbunden sind.
Es scheint, dass t-Tests für symmetrische Verteilungen schnell konvergieren , dass der Test mit vorzeichenbehaftetem Rang Symmetrie annimmt und dass es für eine symmetrische Verteilung keinen Unterschied zwischen Mittelwerten / Pseudomedianern / Medianen gibt. Wenn ja, unter welchen Umständen würde ein relativ unerfahrener Statistiker den Signed-Rank-Test nützlich finden, wenn er sowohl den T-Test als auch den Sign-Test zur Verfügung hat? Wenn einer meiner (z. B. sozialwissenschaftlichen) Studenten versucht zu testen, ob eine Behandlung besser abschneidet als eine andere (durch eine relativ leicht zu interpretierende Maßnahme, z. B. eine Vorstellung von "durchschnittlichem" Unterschied), habe ich Schwierigkeiten, einen Platz für die unterschriebene zu finden. Rangprüfung, obwohl sie an meiner Universität allgemein gelehrt und ignoriert wird.
Antworten:
Betrachten Sie eine Verteilung von Paardifferenzen, die etwas schwerer als normal ist, aber nicht besonders "spitz"; dann ist der vorzeichenbehaftete Rangtest oft leistungsfähiger als der t-Test, aber auch leistungsfähiger als der vorzeichenbehaftete Test.
Beispielsweise beträgt bei der logistischen Verteilung die asymptotische relative Effizienz des Tests mit vorzeichenbehaftetem Rang im Verhältnis zum t-Test 1,097, sodass der Test mit vorzeichenbehaftetem Rang leistungsfähiger sein sollte als der t (zumindest in größeren Stichproben), aber die asymptotische relative Effizienz des Vorzeichentests relativ zum t-Test beträgt 0,822, so dass der Vorzeichentest weniger leistungsfähig wäre als der t (wiederum zumindest bei größeren Stichproben).
Wenn wir zu schwereren Verteilungen übergehen (wobei immer noch zu hohe Verteilungen vermieden werden), wird das t tendenziell relativ schlechter abschneiden, während sich der Vorzeichentest etwas verbessern sollte und sowohl das Vorzeichen als auch der Vorzeichenrang das t beim Erkennen kleiner übertreffen Effekte mit erheblichen Rändern (dh erfordern viel kleinere Stichprobengrößen, um einen Effekt zu erkennen). Es wird eine große Klasse von Distributionen geben, für die der Signed-Rank-Test der beste der drei ist.
Hier ist ein Beispiel - die Verteilung. Die Leistung wurde für die drei Tests bei n = 100 für ein Signifikanzniveau von 5% simuliert. Die Leistung für den Test ist schwarz markiert, die für den von Wilcoxon signierten Rang in rot und der Vorzeichentest in grün. Die verfügbaren Signifikanzniveaus des Vorzeichentests enthielten keine besonders nahe 5%. In diesem Fall wurde ein randomisierter Test verwendet, um dem richtigen Signifikanzniveau nahe zu kommen. Die x-Achse ist der Parameter, der die Verschiebung vom Nullfall darstellt (die Tests waren alle zweiseitig, sodass die tatsächliche Leistungskurve um 0 symmetrisch wäre).t3 δt δ
Wie wir in der Darstellung sehen, hat der vorzeichenbehaftete Rangtest mehr Leistung als der Vorzeichentest, der wiederum mehr Leistung als der t-Test hat.
quelle