In welcher Situation wäre Wilcoxons Signed-Rank-Test dem T-Test oder dem Sign-Test vorzuziehen?

10

Nach einigen Diskussionen (unten) habe ich jetzt ein klareres Bild einer fokussierten Frage. Hier ist eine überarbeitete Frage, obwohl einige der Kommentare jetzt möglicherweise nicht mit der ursprünglichen Frage verbunden sind.

Es scheint, dass t-Tests für symmetrische Verteilungen schnell konvergieren , dass der Test mit vorzeichenbehaftetem Rang Symmetrie annimmt und dass es für eine symmetrische Verteilung keinen Unterschied zwischen Mittelwerten / Pseudomedianern / Medianen gibt. Wenn ja, unter welchen Umständen würde ein relativ unerfahrener Statistiker den Signed-Rank-Test nützlich finden, wenn er sowohl den T-Test als auch den Sign-Test zur Verfügung hat? Wenn einer meiner (z. B. sozialwissenschaftlichen) Studenten versucht zu testen, ob eine Behandlung besser abschneidet als eine andere (durch eine relativ leicht zu interpretierende Maßnahme, z. B. eine Vorstellung von "durchschnittlichem" Unterschied), habe ich Schwierigkeiten, einen Platz für die unterschriebene zu finden. Rangprüfung, obwohl sie an meiner Universität allgemein gelehrt und ignoriert wird.

nur ich
quelle
1
Justme: Natürlich habe ich nicht darüber nachgedacht.
JonB
1
Es hängt davon ab, auf wessen konventionelle Weisheit Sie schauen; Meine Erfahrung ist ganz anders als deine. Sicherlich ist es einfach, Ressourcen zu finden, die eindeutig angeben, dass die Symmetrie der Differenzwerte unter der Null angenommen wird (und dass dies wichtig ist). Beachten Sie jedoch, dass dies unter Null liegt. Daher ist es nicht unbedingt relevant, dass die Differenzwerte in einer Stichprobe nicht symmetrisch sind. Unter der Alternative muss keine Symmetrie vorhanden sein. Wenn Sie sehr sicher sind, dass die Symmetrie gelten würde, wenn die Null wahr wäre - und in vielen Fällen ist dies eine sehr plausible Annahme - ... ctd
Glen_b - Monica
1
ctd ... dann gibt es kein Problem. Das Problem ist, wenn Sie nicht bereit sind, es vorher anzunehmen, wissen Sie nicht, ob eine Ablehnung durch ein Versagen der Annahme verursacht wurde. Das Offensichtliche ist dann einfach , es nicht anzunehmen.
Glen_b -State Monica
2
Beachten Sie zuerst Ihren zweiten Kommentar: (zusätzlich zu dem, was Sie bereits erwähnt haben), beachten Sie, dass 1. normale Annahmen parametrische Tests nicht erschöpfen. 2. Der vorzeichenbehaftete Rangtest ist eigentlich kein Test für Mediane, sondern für Hodges-Lehmann-Statistiken / Pseudomediane mit einer Stichprobe (wenn Sie der Alternative die Annahme der Symmetrie hinzufügen, wird er auch auf Mediane getestet, und wo Mittel vorhanden sind). unter anderem auch für Mittel). In ähnlicher Weise ist der Rang-Summen-Test kein Test der Mediane, sondern der paarweisen Medianunterschiede. Sie haben Recht, dass das Niveau des signierten Rang-Tests sehr empfindlich auf Asymmetrie reagieren kann.
Glen_b -State Monica
2
Zu Ihrem früheren Kommentar: 1 Symmetrie wird im Allgemeinen nicht als Teil der Null angesehen, sondern als Teil der Annahmen, die Sie benötigen, damit die Permutationen unter der Null austauschbar sind. 2. Wie bereits erwähnt, handelt es sich nicht um einen Median-Test, sondern um einen Pseudomedian-Test, und dies gilt auch für eine asymmetrische Alternative. Es ist wahr, dass die Interpretation manchmal einfacher ist, wenn Sie einige restriktive Annahmen treffen, aber die Einschränkungen, die erforderlich sind, um einen vernünftigen Test für Mediane zu erstellen, müssen nicht so streng sein wie die Annahme einer Symmetrie unter der Alternative.
Glen_b -State Monica

Antworten:

3

Betrachten Sie eine Verteilung von Paardifferenzen, die etwas schwerer als normal ist, aber nicht besonders "spitz"; dann ist der vorzeichenbehaftete Rangtest oft leistungsfähiger als der t-Test, aber auch leistungsfähiger als der vorzeichenbehaftete Test.

Beispielsweise beträgt bei der logistischen Verteilung die asymptotische relative Effizienz des Tests mit vorzeichenbehaftetem Rang im Verhältnis zum t-Test 1,097, sodass der Test mit vorzeichenbehaftetem Rang leistungsfähiger sein sollte als der t (zumindest in größeren Stichproben), aber die asymptotische relative Effizienz des Vorzeichentests relativ zum t-Test beträgt 0,822, so dass der Vorzeichentest weniger leistungsfähig wäre als der t (wiederum zumindest bei größeren Stichproben).

Wenn wir zu schwereren Verteilungen übergehen (wobei immer noch zu hohe Verteilungen vermieden werden), wird das t tendenziell relativ schlechter abschneiden, während sich der Vorzeichentest etwas verbessern sollte und sowohl das Vorzeichen als auch der Vorzeichenrang das t beim Erkennen kleiner übertreffen Effekte mit erheblichen Rändern (dh erfordern viel kleinere Stichprobengrößen, um einen Effekt zu erkennen). Es wird eine große Klasse von Distributionen geben, für die der Signed-Rank-Test der beste der drei ist.

Hier ist ein Beispiel - die Verteilung. Die Leistung wurde für die drei Tests bei n = 100 für ein Signifikanzniveau von 5% simuliert. Die Leistung für den Test ist schwarz markiert, die für den von Wilcoxon signierten Rang in rot und der Vorzeichentest in grün. Die verfügbaren Signifikanzniveaus des Vorzeichentests enthielten keine besonders nahe 5%. In diesem Fall wurde ein randomisierter Test verwendet, um dem richtigen Signifikanzniveau nahe zu kommen. Die x-Achse ist der Parameter, der die Verschiebung vom Nullfall darstellt (die Tests waren alle zweiseitig, sodass die tatsächliche Leistungskurve um 0 symmetrisch wäre).t3δtδ

Darstellung der Leistungskurven für das t, Wilcoxon signierte Rang- und Vorzeichentests mit n = 100 und 5% Signifikanzniveau für das t3

Wie wir in der Darstellung sehen, hat der vorzeichenbehaftete Rangtest mehr Leistung als der Vorzeichentest, der wiederum mehr Leistung als der t-Test hat.

Glen_b - Monica neu starten
quelle
Vielen Dank für dieses @Glen_b! Ich kämpfe immer noch darum, herauszufinden, wo es in unseren Lehrplan passt, wenn wir Studenten haben, für die selbst das Konzept der Macht den Rahmen ihres Studiums sprengt, und warum wir Wilcoxon als Hauptalternative zum gepaarten t unterrichten. Dies gibt jedoch einige nützliche Motivationen. Vielen Dank!
Justme
Übrigens, nachdem ich überlegt hatte, welches Verteilungsmerkmal die asymptotische Varianz des Medians (und damit die Potenz des Vorzeichentests) beeinflusst, kam mir ein Beispiel in den Sinn, bei dem die relativen Positionen des t- und des Vorzeichentests umgekehrt sind. Daher denke ich, dass es eine gute Möglichkeit gibt, einen Fall zu konstruieren, in dem der signierte Rangtest erheblich besser abschneidet als jeder der beiden anderen Tests. Ich werde noch mehr damit spielen, wenn ich kann, und vielleicht etwas darauf schreiben.
Glen_b -Reinstate Monica
Was Ihren Lehrplan angeht, ist es klar, dass es definitiv Fälle gibt, in denen der vorzeichenbehaftete Rang beide anderen Tests übertrifft (wie ich in meinen Antworten dargelegt habe - Verteilungen, die etwas schwerer als normal sind, aber nicht besonders hoch sind); Das t ist im normalen oder leichteren Zustand besser, und der Vorzeichentest ist besser, wenn die Verteilung einen starken Peak aufweist (der häufig mit sehr schweren Schwänzen einhergeht, dies aber nicht muss). [Passen Sie jedoch auf, dass Sie diese Ideen nicht mit bloßen Änderungen der Verbreitung verwechseln, die ihre relativen Eigenschaften nicht verändern.] ... Ich bin sicher, Sie könnten ein paar solcher Sätze in
Glen_b
Vielen Dank @Glen_b! Das Problem ist, dass ich den Lehrplan nicht unterrichte, sondern nur unterstütze! Der Lehrplan in den meisten Abteilungen scheint zu sein: (i) einen Hypothesentest der Normalität zu verwenden (töte mich jetzt) ​​und basierend darauf (ii) entweder Wilcoxon oder t-Test zu verwenden. Die feineren Details der Schultern der Verteilung usw. werden also niemals berührt, und die Macht wird auch nicht berührt, nur ob die Annahmen erfüllt sind (auf eine leicht abfallende Weise). Aber Ihre Gedanken sind zumindest für mich persönlich sehr hilfreich!
Justme
Toller Beitrag @Glen_b! Kann ich aus der Auswahl der beiden Tests schließen, dass wir immer zuerst die Leistung berechnen sollten? Anstatt der Annahme zu folgen, dass immer der Vorzeichentest verwendet wird, wenn die Differenzverteilung nicht normal ist? Vielen Dank!
Lumos