Wie kann man zwischen einem Vorzeichentest und einem Wilcoxon-Vorzeichenrang-Test wählen?

11

Ich versuche, einen dieser beiden Tests auszuwählen, um gepaarte Daten zu analysieren. Kennt jemand Faustregeln, welche im Allgemeinen zu wählen sind?

Sheldon
quelle
Silverfishs Antwort dort berührt es nur (kaum). Diese Frage ist ziemlich allgemein, ich frage mich, ob wir eine spezifischere tolerieren können.
Glen_b -State Monica
Sheldon - Der vorzeichenbehaftete Rangtest geht von einer Annahme über die Symmetrie der Unterschiede aus, die der Vorzeichentest nicht hat. Wenn andererseits nahezu symmetrisch ist und der Schwanz nicht sehr schwer ist, sollte der vorzeichenbehaftete Rang mehr Kraft haben.
Glen_b -State Monica
Genau. In meinem Fall hat der Rangsummentest den größten p-Wert, der Vorzeichentest ist das Medium, der vorzeichenbehaftete Rang ist der kleinste. Daher hat es mehr Leistung.
Sheldon
@Sheldon Nein, so entscheiden Sie nicht , dass ein Test mehr Leistung hat - ein niedrigerer p-Wert in Bezug auf eine Stichprobe kann einfach auf die Abweichungen dieser Stichprobe zurückzuführen sein, während es bei der Leistung um das Verhalten aller aus derselben Stichprobe gezogenen Zufallsstichproben geht Population. Ich sollte besser eine Antwort schreiben, die die vorherigen Kommentare erweitert, erklärt, was es bedeutet, mehr Macht zu haben, und einige der Umstände erklärt, unter denen jeder besser abschneiden könnte.
Glen_b -State Monica
3
@Glen_b, ich würde sagen, dass derzeit die wichtigste Überlegung ist, was für zukünftige Leser am hilfreichsten sein wird. Ich denke, wer nach einem Vorzeichentest gegen einen Wilcoxon-Test sucht und diesen Thread findet, wird viel mehr davon profitieren, wenn er Ihre spezifische Antwort hier liest, als wenn er zu diesem Mega-Thread weitergeleitet wird, in dem er wahrscheinlich verloren geht und keine Antwort findet.
Amöbe sagt Reinstate Monica

Antworten:

9

Ich versuche, einen dieser beiden Tests auszuwählen, um gepaarte Daten zu analysieren. Kennt jemand Faustregeln, welche im Allgemeinen zu wählen sind?

Der vorzeichenbehaftete Rangtest geht von einer Annahme über die Symmetrie der Unterschiede unter der Null aus , die der Vorzeichentest nicht benötigt. (Diese Annahme ist notwendig, damit die Permutationen der Zeichen, die mit den vorzeichenlosen Unterschiedsreihen verbunden sind, gleich wahrscheinlich sind.)

Auf der anderen Seite sollte der signierte Rang mehr Macht haben, wenn die Population nahezu symmetrisch ist und der Schwanz nicht sehr schwer ist.

[Dies sollte nicht als Ratschlag verstanden werden, anhand der Stichprobe zwischen ihnen zu wählen . Im Allgemeinen führt dies zu Testeigenschaften, die vom Nennwert abweichen (Tests können verzerrt sein, die tatsächlichen Signifikanzniveaus entsprechen nicht mehr dem, was sie zu sein scheinen, berechnete p-Werte stellen keine echten p-Werte dar usw.). Stattdessen sollten die Merkmale nach Möglichkeit auf der Grundlage des Wissens außerhalb der Stichprobe bewertet werden, auf die der Test angewendet wird - sei es nach Fachkenntnissen, Vertrautheit mit anderen Datensätzen wie diesem, Aufteilung der Stichproben, ...]

In meinem Fall hat der Rangsummentest den größten p-Wert, der Vorzeichentest ist das Medium, der vorzeichenbehaftete Rang ist der kleinste. Daher hat es mehr Leistung.

Auf diese Weise entscheiden Sie nicht, dass ein Test mehr Leistung hat - ein niedrigerer p-Wert in Bezug auf eine Stichprobe kann einfach auf die Abweichungen dieser Stichprobe zurückzuführen sein, während es bei der Leistung um das Verhalten aller Zufallsstichproben geht, die aus derselben Population stammen.

Stellen Sie sich vor, Sie haben es mit einer bestimmten Situation zu tun, in der die Population der Paardifferenzen etwas von 0 entfernt zentriert ist (dh, dass auf eine bestimmte Weise falsch ist). Bei wiederholter Probenahme unter denselben Bedingungen (einschließlich Stichprobengröße) ist die Leistung die Ablehnungsrate für diese bestimmte Population.H0

In ähnlicher Weise könnten wir die Abstoßungsrate für eine Folge von Populationen mit unterschiedlicher Position * von Paardifferenzen berechnen und eine gesamte Leistungskurve erhalten. Dann würde "höhere Leistung" der gesamten Leistungskurve (oder fast der gesamten, wobei zu beachten ist, dass beide das gleiche Signifikanzniveau haben sollten) für einen übereinander liegenden Test entsprechen.

* Sie könnten es als Median für die vorliegende Diskussion betrachten - während der Schätzer für den vorzeichenbehafteten Rangtest der Median der paarweisen Mittelwerte der Paardifferenzen ist, sollte der Standortschätzer unter der Symmetrieannahme auch eine geeignete Schätzung des Medianpaars sein Unterschied.


Hier ist eine verwandte Frage, wie man zwischen t-Test oder nicht-parametrischem Test wählt, z. B. Wilcoxon in kleinen Proben . Eine der Antworten beinhaltet eine (kurze) Diskussion der vorliegenden Ausgabe.

Glen_b - Monica neu starten
quelle
Vielen Dank für Ihre Klarstellung. Ich denke, die wichtigste Nachricht zum Mitnehmen ist die Annahme über die Symmetrie der Unterschiede für den Test mit Vorzeichen, die in meinem Fall verletzt wird. Ich habe das Gefühl, dass es außer der Überprüfung, ob die Symmetriekriterien erfüllt sind, keine Möglichkeit gibt, festzustellen, welcher Test falsch ist. Vielmehr klingt es vernünftig zu sagen, welches angemessener ist.
Sheldon
1
@Sheldon Wenn Sie nicht sicher sind, dass die Bedingungen für den Test nahezu erfüllt sind, sollten Sie im Allgemeinen nicht davon ausgehen, dass dies der Fall ist. Das heißt, vielleicht wäre der Vorzeichentest eine bessere Idee. Ich hoffe, dass ich meiner Antwort weitere Informationen hinzufügen kann, wenn ich die Gelegenheit dazu habe.
Glen_b -Reinstate Monica