Was ist die Intuition hinter austauschbaren Proben unter der Nullhypothese?

15

Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein nicht parametrischer Test Mann-Whitney-U-testwürde dazu führen, dass mehr Informationen verloren gehen. Eine einzige Annahme, die bei dieser Art von Test nicht übersehen werden sollte, ist die Annahme der Austauschbarkeit der Proben unter der Nullhypothese. Es ist auch bemerkenswert, dass diese Art von Ansatz auch angewendet werden kann, wenn mehr als zwei Beispiele vorhanden sind, wie sie in coinR-Paketen implementiert sind .

Können Sie bitte eine bildliche Sprache oder eine begriffliche Intuition in einfachem Englisch verwenden, um diese Annahme zu veranschaulichen? Dies wäre sehr nützlich, um dieses übersehene Problem bei Nicht-Statistikern wie mir zu klären.

Hinweis:
Es wäre sehr hilfreich, einen Fall zu erwähnen, in dem die Anwendung eines Permutationstests unter der gleichen Annahme nicht gültig oder ungültig ist.

Update:
Angenommen, ich habe zufällig 50 Probanden aus der örtlichen Klinik in meinem Distrikt gesammelt. Sie wurden nach dem Zufallsprinzip im Verhältnis 1: 1 mit einem Medikament oder einem Placebo behandelt. Sie wurden alle für Parameter 1 Par1bei V1 (Basislinie), V2 (3 Monate später) und V3 (1 Jahr später) gemessen . Alle 50 Probanden können auf der Grundlage von Merkmal A in zwei Gruppen unterteilt werden. A positiv = 20 und A negativ = 30. Sie können basierend auf Merkmal B auch in zwei weitere Gruppen unterteilt werden. B positiv = 15 und B negativ = 35.
Jetzt habe ich Werte Par1von allen Themen bei allen Besuchen. Kann ich unter der Annahme der Austauschbarkeit einen Vergleich zwischen den Ebenen des Par1Permutationstests anstellen, wenn ich:
- die Probanden mit dem Medikament mit denjenigen vergleichen würde, die ein Placebo bei V2 erhalten haben?
- Probanden mit Merkmal A mit denen mit Merkmal B bei V2 vergleichen?
- Probanden mit Merkmal A bei V2 mit Probanden mit Merkmal A aber bei V3 vergleichen?
- In welcher Situation wäre dieser Vergleich ungültig und würde die Annahme der Austauschbarkeit verletzen?

Promotion
quelle
4
Angenommen, ich hatte jede Beobachtung auf einem separaten Blatt Loseblattpapier, und als ich Ihnen den Stapel reichte, rutschte ich aus, und die Blätter flogen in alle Richtungen heraus, als sie sich auf dem Boden niederließen. Es wäre eine Schande, wenn dies die Gültigkeit des Tests, den Sie mit diesen Daten durchführen wollten, zerstören würde. Wenn Ihre Beobachtungen austauschbar sind und Sie darauf basierend einen Test durchführen, würden Sie mich trösten und mir sagen, ich solle mir keine Sorgen machen, während Sie mir helfen, die Papiere vom Boden aufzusammeln. Wenn nicht, und die Datenerfassung war besonders teuer, muss ich möglicherweise um mein Leben rennen.
Kardinal,
2
Auf der anderen Seite, um tut Angelegenheit für Dinge wie Zeitreihendaten (im Allgemeinen) und Tests sollen in der Regel diese Ordnung in angemessener Weise respektieren.
Kardinal
@ Cardinal, während Ihre intuitive Geschichte ein anschauliches Bild davon gezeichnet hat, wie diese Annahme aussieht, bin ich immer noch verwirrt, wie man beurteilt, ob die gefallenen wertvollen Papiere austauschbar waren oder nicht. Sie können für einen anderen Kommentar laufen, wenn es möglich ist!
Promotion

Antworten:

7

Erstens, die nicht-bildliche Beschreibung: Austauschbarkeit bedeutet, dass die gemeinsame Verteilung für Permutationen der Werte jeder Variablen in der gemeinsamen Verteilung unveränderlich ist (dh usw.). Ist dies nicht der Fall, ist das Zählen von Permutationen keine gültige Methode zum Testen der Nullhypothese, da jede Permutation ein anderes Gewicht (Wahrscheinlichkeit / Dichte) hat. Permutationstests hängen von jeder Zuordnung eines bestimmten Satzes numerischer Werte zu Ihren Variablen mit derselben Dichte / Wahrscheinlichkeit ab.fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1)

Ein konkretes Beispiel für fehlende Austauschbarkeit: Sie haben N Gläser mit jeweils 100 nummerierten Tickets. Die ersten M Gläser haben Tickets mit nur ungeraden Nummern von 1-200 (1 Ticket pro Nummer), die verbleibenden NM haben Tickets für nur gerade Nummern zwischen 1 - 200. Wenn Sie ein Ticket aus jedem Glas zufällig auswählen, erhalten Sie eine gemeinsame Verteilung auf Probenergebnisse. In diesem Fall ist Sie können also nicht einfach die Permutationen der Werte 1 bis N zählen. Im Allgemeinen schlägt die Austauschbarkeit fehl, wenn Ihre Probe in Untergruppen unterteilt werden kann (wie ich es bei den Gläsern getan habe). Die Austauschbarkeit würde wiederhergestellt, wenn Sie in den Fällen, in denen Sie 1 Probe aus N Gläsern entnommen haben, N Proben aus 1 Glas entnommen haben. Dann wäre die gemeinsame Verteilung gegenüber Permutationen unveränderlich.f(x1=1,x2=2,X3=3...XN=N)f(x1=N,x2=N1,X3=N2...XN=1)


quelle
+1, obwohl die Austauschbarkeit gut erklärt ist, aber dennoch war ich beim Versuch, die Glasmetapher auf die vorliegende Studie anzuwenden, gestolpert. (siehe das Update der Frage). Wie kann ich angesichts der Dauer der Besuche und der Untergruppierung nach Merkmalen beurteilen, ob der Vergleich dieser Werte austauschbar wäre oder nicht?
Promotion
@doctorate: Es hört sich so an, als würden Sie Ihre Gruppen nach Faktoren schichten, die für das Ergebnis von Par1 relevant sind, richtig? Solange Sie Permutationen in einem bestimmten A / B-Feturquadranten verwenden, würde ich annehmen, dass Ihre Themen austauschbar sind. Ihr erster Test, der alle Funktionen abdeckt, muss weiter verarbeitet werden, bevor Sie einen Test verwenden können, der auf Austauschbarkeit beruht. insbesondere, müssen Sie die Wirkung der Behandlung und richtig für die verwirrende Wirkung von Funktionen A und B quantifizieren - sonst goup Größe die Gesamtergebnisse beeinflussen (Simpsons Paradox) wird
1
@doctorate: Mir ist aufgefallen, dass mein obiger Kommentar etwas schief gewesen sein könnte, was Sie wollen: Die Gläser in Ihrem Fall wären die Merkmalspaare, dh (A +, B +), (A-, B +), (A +, B -), (B-, A-) für insgesamt 4 "Gläser". Hilft das, es konkreter zu machen?
Tks, aber was Nicht-Statistiker wie mich verwirrt, ist, wie man beurteilen kann, ob diese Annahme erfüllt wurde oder nicht? Es gibt oft Tests, um Annahmen zu überprüfen, z. B. für die Normalität gibt es Shapiro-Wilk-Test. Aber ich frage mich, welcher Test die Austauschbarkeit untersuchen würde? Andernfalls wäre die Definition sehr schwierig oder vage, und zwei Statistiker sind sich möglicherweise nicht über diese oder jene Untergruppe einig. Wie Sie bereits erwähnt haben, war das im A / B-Quadranten kein Problem, aber im Bereich Arzneimittel / Placebo haben Sie Bedenken geäußert. Gibt es also einen Säuretest für diese Annahme?
Promotion
2
In Bezug auf die Austauschbarkeit gibt es keinen "Test" für die Austauschbarkeit. Im Gegensatz zur Unabhängigkeit (die testbar ist) ist die Austauschbarkeit eher eine Modellannahme, bei der Sie bei wiederholten Stichproben wie der von Ihnen genommenen feststellen würden, dass jede Permutation in genau demselben Bruchteil der Zeit auftritt. Sie haben nur 1 Probe, also können Sie es nicht "testen".