Wie wird mit dem Mittelwert umgegangen, wenn Personen Permutationstests durchführen, um eine einzelne Stichprobe mit einem Mittelwert zu vergleichen (z. B. wie bei einem Permutationstest)? Ich habe Implementierungen gesehen, die einen Mittelwert und eine Stichprobe für einen Permutationstest verwenden, aber es ist unklar, was sie tatsächlich unter der Haube tun. Gibt es überhaupt eine sinnvolle Möglichkeit, einen Permutationstest (z. B. t-Test) für eine Probe gegenüber einem angenommenen Mittelwert durchzuführen? Oder verwenden sie alternativ nur einen Nicht-Permutationstest unter der Haube? (z. B. trotz Aufrufen einer Permutationsfunktion oder Setzen eines Permutationstest-Flags, wobei standardmäßig ein Standard-T-Test oder eine ähnliche Funktion verwendet wird)
In einem Standard-Permutationstest mit zwei Stichproben würde man zwei Gruppen haben und die Zuordnung von Etiketten zufällig festlegen. Wie wird dies jedoch gehandhabt, wenn eine "Gruppe" ein angenommener Mittelwert ist? Offensichtlich hat ein angenommener Mittelwert an und für sich keine Stichprobengröße. Was ist also die typische Art, den Mittelwert in ein Permutationsformat umzuwandeln? Wird angenommen, dass die "mittlere" Stichprobe ein einzelner Punkt ist? Eine Stichprobe gleicher Größe wie die Stichprobengruppe? Eine unendlich große Probe?
Angesichts der Tatsache, dass ein angenommener Mittelwert angenommen wird, würde ich sagen, dass er technisch entweder unendliche Unterstützung hat oder welche Unterstützung Sie auch immer dafür annehmen möchten. Keines davon ist jedoch für eine tatsächliche Berechnung sehr nützlich. Eine gleich große Stichprobe mit Werten, die alle dem Mittelwert entsprechen, scheint das zu sein, was manchmal bei einigen Tests gemacht wird (z. B. füllen Sie einfach die andere Hälfte der Paare mit der angenommenen Position aus). Dies ist ein wenig sinnvoll, da es sich um die Stichprobe gleicher Länge handelt, die Sie sehen würden, wenn Ihr angenommener Mittelwert ohne Varianz korrekt wäre.
Meine Frage lautet also: Emulieren die Leute in der Praxis tatsächlich die Randomisierung von Permutationstest-Labels, wenn der zweite Satz ein Mittelwert (oder ein ähnlicher abstrakter angenommener Wert) ist? Wenn ja, wie gehen die Leute dabei mit der Randomisierung von Etiketten um?
quelle
Antworten:
Erweitern Sie den Kommentar von Glen_b zu einer Antwort
Ein ungefährer Permutationstest mit einer Stichprobe für den Mittelwert einer Stichprobe gegen eine Nullhypothese des Mittelwerts von Null wird implementiert, indem den Daten in der Stichprobe zufällige Vorzeichen zugewiesen werden. Nicht-Null-Nullhypothesen können getestet werden, indem der gewünschte Nullmittelwert von den Daten subtrahiert wird.
Dies ist in der Quelle der R-Funktion
onetPermutation
im Paket leicht zu erkennenDAAG
. Hier ist ein Auszug des relevanten Codes mit Kommentaren, die ich hinzugefügt habe:quelle