Test auf mittlere Differenz

8

Bei Stichproben von zwei Verteilungen suche ich nach einem Test für die Median-Differenz (dh ich lehne Null ab, um zu beweisen, dass die Mediane unterschiedlich sind.) Ich möchte nichts über beide Verteilungen annehmen. Gibt es einen Standardtest für diese Situation?

Ich kenne den Median-Test von Mood, aber ich glaube, er geht davon aus, dass die Verteilungen verschoben sind. für einige . Ich unterstütze diese Behauptung mit folgenden Quellen:F2(t)=F1(ta)aR

Link1 Link2 Link3

Manuel
quelle
1
+1 @Firebug ist fast korrekt: Der Run-Sum-Test testet nur die Median-Differenz unter strengen zusätzlichen Annahmen (was gegen die vom OP angegebenen Desiderata verstößt).
Alexis
@Alexis ist ein Median-Test, wenn die Verteilung symmetrisch ist. In diesem Fall ist es auch ein Mittelwerttest.
AdamO
@AdamO Es ist ein Median-Test, wenn beide Verteilungen die gleiche Form haben (symmetrisch oder nicht) und wenn beide Verteilungen die gleiche Varianz haben ... dann ist es einfach ein Test der Ortsverschiebung. (Und ja, dann ist es zufällig auch ein Test für den mittleren Unterschied.)
Alexis
@Alexis das Kaninchenloch hinunter. Ich habe mich gerade daran erinnert, das auf R-Dokumenten gelesen zu haben, also habe ich darüber nachgedacht, es zu veröffentlichen, haha
Firebug

Antworten:

6

Sie könnten einen Permutationstest in Betracht ziehen.

median.test <- function(x,y, NREPS=1e4) {
  z <- c(x,y)
  i <- rep.int(0:1, c(length(x), length(y)))
  v <- diff(tapply(z,i,median))
  v.rep <- replicate(NREPS, {
    diff(tapply(z,sample(i),median))
  })
  v.rep <- c(v, v.rep)
  pmin(mean(v < v.rep), mean(v>v.rep))*2
}

set.seed(123)
n1 <- 100
n2 <- 200
## the two samples
x <- rnorm(n1, mean=1)
y <- rexp(n2, rate=1)
median.test(x,y)

Geben Sie hier die Bildbeschreibung ein

Gibt einen zweiseitigen p-Wert von 0,1112 an, was ein Beweis dafür ist, wie ineffizient ein Median-Test sein kann, wenn wir keine Verteilungstendenz ansprechen.

Wenn wir MLE verwendet haben, kann der 95% -KI für den Median für die Normalen einfach aus dem Mittelwert entnommen werden, da der Mittelwert der Median in einer Normalverteilung ist, also 1,00 bis 1,18. Der 95% CI für den Median für das Exponential kann als umrahmt werden , was nach der Delta-Methode 0,63 bis 0,80 beträgt. Daher ist der Wald-Test bei 0,05 statistisch signifikant, der Median-Test jedoch nicht.log(2)/X¯

AdamO
quelle
Eine Warnung: "Die Situation ist noch schlimmer, wenn ein Test auf einem Unterschied in den Stichprobenmedianwerten basiert, in dem Sinne, dass die asymptotische Abstoßungswahrscheinlichkeit des Permutationstests unabhängig von der Stichprobengröße unter sehr strengen Bedingungen α beträgt, was im Wesentlichen nur in bedeutet der Fall, in dem die zugrunde liegenden Verteilungen gleich sind. " von projecteuclid.org/euclid.aos/1366138199 . Eine bessere Lösung für diese Autoren wäre die Verwendung einer studendisierten Version der Teststatistik.
Julian Karls
4

Angenommen, Ihr Ergebnis ist ordinal oder intervallwertig, können Sie den nichtparametrischen medianTest mit k = 2 verwenden. Hier ist eine Beschreibung der Implementierung von Stata :

Der Median-Test untersucht, ob es wahrscheinlich ist, dass zwei oder mehr Proben aus Populationen mit demselben Median stammen. Die Nullhypothese lautet, dass die Proben aus Populationen mit demselben Median gezogen wurden. Die alternative Hypothese ist, dass mindestens eine Stichprobe aus einer Population mit einem anderen Median gezogen wurde. Der Test sollte nur mit Ordnungs- oder Intervalldaten verwendet werden. Angenommen, es gibt Bewertungswerte für k unabhängige zu vergleichende Stichproben. Der Median-Test wird durchgeführt, indem zunächst der Median-Score für alle Beobachtungen zusammen berechnet wird, unabhängig von der Stichprobengruppe. Jede Punktzahl wird mit diesem berechneten Grand Median verglichen und als über dem Grand Median, unter dem Grand Median oder gleich dem Grand Median klassifiziert. Beobachtungen mit Punktzahlen, die dem großen Median entsprechen, können gelöscht und der Gruppe „oben“ hinzugefügt werden. zur Gruppe "unten" hinzugefügt oder zwischen den beiden Gruppen aufgeteilt. Sobald alle Beobachtungen klassifiziert sind, werden die Daten in eine 2xk-Kontingenztabelle umgewandelt und ein Pearson-Chi-Quadrat-Test oder ein genauer Fisher-Test durchgeführt.

Dimitriy V. Masterov
quelle
Ich glaube, das ist Moods Median-Test. Sind Sie sicher, dass nicht davon ausgegangen wird, dass sich die Verteilung verschiebt?
Manuel
@Manuel Ich kenne den Median-Test von Mood nicht, aber er scheint dem, was ich vorgeschlagen habe, sehr ähnlich zu sein. Die Verschiebungsannahme erscheint jedoch nicht unter den anderen in der von mir verknüpften Hilfedatei, und mir ist nicht klar, wo dies hier erforderlich wäre. Es ist möglich, dass mir etwas fehlt, aber vielleicht können Sie hinzufügen, warum Sie glauben, dass es gebraucht wird?
Dimitriy V. Masterov
Ich habe der Frage einige Links hinzugefügt, auf denen steht, dass eine verschobene Verteilung notwendig ist.
Manuel