Permutationstest zum Vergleich einer einzelnen Probe mit einem Mittelwert

10

Wie wird mit dem Mittelwert umgegangen, wenn Personen Permutationstests durchführen, um eine einzelne Stichprobe mit einem Mittelwert zu vergleichen (z. B. wie bei einem Permutationstest)? Ich habe Implementierungen gesehen, die einen Mittelwert und eine Stichprobe für einen Permutationstest verwenden, aber es ist unklar, was sie tatsächlich unter der Haube tun. Gibt es überhaupt eine sinnvolle Möglichkeit, einen Permutationstest (z. B. t-Test) für eine Probe gegenüber einem angenommenen Mittelwert durchzuführen? Oder verwenden sie alternativ nur einen Nicht-Permutationstest unter der Haube? (z. B. trotz Aufrufen einer Permutationsfunktion oder Setzen eines Permutationstest-Flags, wobei standardmäßig ein Standard-T-Test oder eine ähnliche Funktion verwendet wird)

In einem Standard-Permutationstest mit zwei Stichproben würde man zwei Gruppen haben und die Zuordnung von Etiketten zufällig festlegen. Wie wird dies jedoch gehandhabt, wenn eine "Gruppe" ein angenommener Mittelwert ist? Offensichtlich hat ein angenommener Mittelwert an und für sich keine Stichprobengröße. Was ist also die typische Art, den Mittelwert in ein Permutationsformat umzuwandeln? Wird angenommen, dass die "mittlere" Stichprobe ein einzelner Punkt ist? Eine Stichprobe gleicher Größe wie die Stichprobengruppe? Eine unendlich große Probe?

Angesichts der Tatsache, dass ein angenommener Mittelwert angenommen wird, würde ich sagen, dass er technisch entweder unendliche Unterstützung hat oder welche Unterstützung Sie auch immer dafür annehmen möchten. Keines davon ist jedoch für eine tatsächliche Berechnung sehr nützlich. Eine gleich große Stichprobe mit Werten, die alle dem Mittelwert entsprechen, scheint das zu sein, was manchmal bei einigen Tests gemacht wird (z. B. füllen Sie einfach die andere Hälfte der Paare mit der angenommenen Position aus). Dies ist ein wenig sinnvoll, da es sich um die Stichprobe gleicher Länge handelt, die Sie sehen würden, wenn Ihr angenommener Mittelwert ohne Varianz korrekt wäre.

Meine Frage lautet also: Emulieren die Leute in der Praxis tatsächlich die Randomisierung von Permutationstest-Labels, wenn der zweite Satz ein Mittelwert (oder ein ähnlicher abstrakter angenommener Wert) ist? Wenn ja, wie gehen die Leute dabei mit der Randomisierung von Etiketten um?

Namey
quelle
6
Ein Permutationstest eines bestimmten hypothetischen Mittelwerts unterscheidet sich nicht vom Subtrahieren dieses hypothetischen Mittelwerts von den Daten und vom Testen gegen einen Mittelwert von Null. Ein gepaarter Test wird hier diskutiert ; Es wird davon ausgegangen, dass die Paare unter der Null dieselbe Verteilung haben, was impliziert, dass die Unterschiede, auf denen der nachfolgende Test mit einer Stichprobe basiert, symmetrisch sind. Auf dieser Basis werden die Zeichen bei jedem Unterschied zufällig umgedreht ... (ctd)
Glen_b - Monica
1
2n
Das macht Sinn. Aber ich denke ein bisschen an die rechnerischen Implementierungen, die die Leute machen. Wenn Sie es in einen Vorzeichentest umwandeln können, machen sich die Leute dann die Mühe, die Permutationen zu berechnen? Für jede Folge der Länge N wäre der vollständige Satz von Permutationen von Vorzeichenflips der gleiche, nicht wahr? Ich würde also denken, dass die Leute es unter der Haube einfach in einen Binomialtest leiten könnten, anstatt die Permutationen, die eine Binomialverteilung ergeben, manuell zu generieren. Ich frage mich hauptsächlich, ob / wann das Umetikettieren und Permutieren Vorteile gegenüber der Verwendung eines Standardtests im Einzelfall- oder Mittelwertfall hat.
Namey
kthxisi[k]|xi|s+11x10x10Alle wären entweder -11,43 oder +11,43. Wenn Sie die absoluten Daten zuerst eingestuft haben, erhalten Sie tatsächlich einen von Wilcoxon signierten Rangtest. Es ist also wie bei der Version ohne Rang (Originaldaten).
Glen_b -State Monica

Antworten:

6

Erweitern Sie den Kommentar von Glen_b zu einer Antwort

Ein ungefährer Permutationstest mit einer Stichprobe für den Mittelwert einer Stichprobe gegen eine Nullhypothese des Mittelwerts von Null wird implementiert, indem den Daten in der Stichprobe zufällige Vorzeichen zugewiesen werden. Nicht-Null-Nullhypothesen können getestet werden, indem der gewünschte Nullmittelwert von den Daten subtrahiert wird.

Dies ist in der Quelle der R-Funktion onetPermutationim Paket leicht zu erkennen DAAG. Hier ist ein Auszug des relevanten Codes mit Kommentaren, die ich hinzugefügt habe:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}
Shadowtalker
quelle