Was sind die Annahmen des Permutationstests?

22

Es wird oft behauptet, dass Permutationstests keine Annahmen haben, aber dies ist sicherlich nicht wahr. Wenn zum Beispiel meine Proben irgendwie korreliert sind, kann ich mir vorstellen, dass es nicht richtig wäre, ihre Etiketten zu vertauschen. Ich denke nur, dass ich zu diesem Problem den folgenden Satz aus Wikipedia gefunden habe: "Eine wichtige Annahme hinter einem Permutationstest ist, dass die Beobachtungen unter der Nullhypothese austauschbar sind." Das verstehe ich nicht.

Was sind die Annahmen von Permutationstests? Und wie hängen diese Annahmen mit verschiedenen möglichen Permutationsschemata zusammen?

rep_ho
quelle
4
(+1) Das Wikipedia-Zitat ist zwar richtig, aber witzig, denn wenn Sie durch den (undeutlichen) Fachjargon kommen, müssen Sie genau die Beobachtungen permutieren, von denen Sie annehmen, dass Sie permutieren können.
Whuber
1
Schwierig zu beantworten, da es so viele verschiedene Permutationstests gibt. Beispielsweise würde für einen Vergleich mit k-Proben die Heteroskedastizität zwischen Gruppen die Annahme der Austauschbarkeit verletzen.
Michael M
1
(+1) Basierend auf Rubin (2015) "Causal Inference for Statistics" können Sie, wenn das Label (oder die Behandlung) von den potenziellen Ergebnissen unabhängig ist, den Permutationstest verwenden. Die Logik ist für jedes Thema, es gibt zwei potenzielle Ergebnisse unter Label A und B sind sie fixiert. Das Label-Zuweisungsverfahren ist zufällig und wenn es vom potenziellen Ergebnis unabhängig ist, können Sie daran denken, dieses Label-Zuweisungsverfahren N-mal durchzuführen. N ist die Gesamtzahl der Permutationen der Labels. Dann können Sie eine Verteilung der Statistik erhalten Wert darauf legen. Dann überprüfen Sie Quantil der beobachteten Menge
KevinKim

Antworten:

17

In der Literatur wird zwischen zwei Arten von Permutationstests unterschieden: (1) Der Randomisierungstest ist der Permutationstest, bei dem die Austauschbarkeit durch zufällige Zuordnung von experimentellen Einheiten zu Bedingungen erfüllt wird. (2) Der Permutationstest ist genau derselbe Test, wird jedoch auf eine Situation angewendet, in der andere Annahmen (dh andere als zufällige Zuweisungen) erforderlich sind, um die Austauschbarkeit zu rechtfertigen.

Einige Referenzen bezüglich der Namenskonventionen (dh Randomisierung vs. Permutation): Kempthorne & Doerfler, Biometrika, 1969; Edgington & amp; Onghena, Randomization Tests, 4th Ed., 2007

Für Annahmen erfordert der Randomisierungstest (dh der Fisher-Randomisierungstest für experimentelle Daten) nur das, was Donald Rubin als stabile Einheitsbehandlungswertannahme (SUTVA) bezeichnet. Siehe Rubins Kommentar von 1980 zu Basus Artikel in JASA. SUTVA ist auch eine der Grundannahmen (zusammen mit starker Unwissenheit) für kausale Schlussfolgerungen im Rahmen des Neyman-Rubin-Modells für mögliche Ergebnisse (vgl. Paul Hollands JASA-Arbeit von 1986). Im Wesentlichen sagt SUTVA, dass es keine Störungen zwischen den Einheiten gibt und dass die Behandlungsbedingungen für alle Empfänger gleich sind. Formal gesehen übernimmt SUTVA die Unabhängigkeit zwischen den potenziellen Ergebnissen und dem Zuweisungsmechanismus.

Betrachten Sie das Problem mit zwei Stichproben bei Teilnehmern, die zufällig einer Kontrollgruppe oder einer Behandlungsgruppe zugeordnet wurden. SUTVA wäre verletzt, wenn beispielsweise zwei Studienteilnehmer bekannt wären und der Zuweisungsstatus eines von ihnen einen Einfluss auf das Ergebnis des anderen ausübte. Dies ist das, was unter keiner Störung zwischen Einheiten zu verstehen ist.

Die obige Diskussion gilt für den Randomisierungstest, bei dem die Teilnehmer zufällig Gruppen zugeordnet wurden. Im Rahmen eines Permutationstests ist auch SUTVA erforderlich, das sich jedoch möglicherweise nicht auf die Randomisierung stützt, da es keine gab.

Wenn keine zufällige Zuordnung vorliegt, kann die Gültigkeit von Permutationstests von Verteilungsannahmen wie identischer Verteilungsform oder symmetrischen Verteilungen (je nach Test) abhängen, um die Austauschbarkeit zu gewährleisten (siehe Box und Anderson, JRSSB, 1955).

In einem interessanten Aufsatz zeigt Hayes, Psych Methods, 1996, durch Simulation, wie sich die Fehlerraten von Typ I erhöhen können, wenn Permutationstests mit nicht randomisierten Daten durchgeführt werden.

bsbk
quelle
-5

Siehe "Einführung in die quantitativen Datenanalyse- und Permutationstests" (Seite 88).

Davester
quelle
1
(-) Zitieren ist keine Antwort. Erstens könnte jemand das Buch, das Sie zitieren, nicht haben. Zweitens geben Sie nicht einmal eine gültige Referenz an, sodass wir nur raten können, was Sie zitieren!
Tim
1
Ich habe das Papier nachgeschlagen (es ist frei zugänglich, übrigens: Danke!). Allerdings beantwortet sie die Frage nicht. Alles, was es aussagt, auf p. 88 lautet: "Permutationstests beruhen nicht auf traditionellen Verteilungsannahmen, sondern auf dem Randomisierungsmodell von RA Fisher (1935/1990)." Wir würden uns freuen, wenn Sie dazu bereit wären, in einer erweiterten Antwort darauf einzugehen.
whuber
In diesem Artikel finden Sie Verweise darauf, wo Sie Annahmen zum Testen der Permutation finden können. Tut mir leid, aber ich habe keine Zeit, nach der Person zu suchen, die die Frage gestellt hat.
Davester
1
Dann hast du die Frage nicht wirklich beantwortet.
Neuronet