Wie ob ?

9

Angenommen, ich habe drei unabhängige Gruppen mit dem Mittelwert .μ1, μ2, μ3

Wie kann ich testen, ob oder nicht, indem Proben aus jeder Gruppe verwende?μ1<μ2<μ3n1, n2, n3

Ich möchte eine allgemeine Methodik kennen, keine detaillierte Berechnung. Ich konnte nicht herausfinden, wie ich meine Hypothese und H_1 setzen sollte .H0H1

456 123
quelle
1
Dies ist ein Fall von auftragsbeschränkter statistischer Inferenz . Es gibt Bücher zum Thema .
kjetil b halvorsen
1
Es gibt auch das alte Buch von Barlow, Bartholemew, Bremner und Brunk Statistical Inference unter Auftragsbeschränkungen (1973) (obwohl es seitdem einige Entwicklungen gegeben hat); Bei nichtparametrischen Tests gibt es den Jonckheere-Terpstra-Test (z. B. siehe Conover) und einen der Match-Tests (probieren Sie das Buch von Neave und Worthington). Normalerweise schreiben Sie eine Gleichheitsnull und eine geordnete Alternative.
Glen_b -Rate State Monica
1
Ein ähnliches Q mit Antwort
kjetil b halvorsen
Hier sollte man sagen, dass man nicht Stichproben aus Gruppe sondern dass man eine Stichprobe der Größe aus Gruppe i , n i i .nii,nii.
Michael Hardy

Antworten:

8

In der Statistik können Sie nicht testen, ob "X wahr ist oder nicht". Sie können nur versuchen, Beweise dafür zu finden, dass eine Nullhypothese falsch ist.

, Ihre Nullhypothese lautet Nehmen wir auch an, Sie haben eine Möglichkeit, den Vektor . Um die Dinge zu behalten, nehmen Sie einfach an, dass Sie einen Schätzer wobei eine Kovariatenmatrix ist. Wir können die Nullhypothese als umschreiben wobei Dies zeigt, dass Ihre Nullhypothese als Ungleichheitsbeschränkung für den Vektor ausgedrückt werden kann . Ein natürlicher Schätzer von ist gegeben durch

H01:μ1<μ2<μ3.
μ=(μ1,μ2,μ3)
xN(μ,Σ),
Σ3×3
Aμ<0,
A=[110011].
AμAμ
AxN(Aμ,AΣA).
Sie können jetzt das Framework zum Testen der Ungleichheitsbeschränkung für normale Vektoren verwenden:

Kudo, Akio (1963). "Ein multivariates Analogon des einseitigen Tests". In: Biometrika 50.3 / 4, S. 403–418.

Dieser Test funktioniert auch, wenn die Normalitätsannahme nur annähernd gilt ("asymptotisch"). Zum Beispiel funktioniert es, wenn Sie Beispielmittel aus den Gruppen zeichnen können. Wenn Sie Stichproben der Größe zeichnen und unabhängig von den Gruppen zeichnen können, ist eine Diagonalmatrix mit Diagonale wobei die Varianz in der Gruppe . In einer Anwendung können Sie die Stichprobenvarianz anstelle der unbekannten Populationsvarianz verwenden, ohne die Eigenschaften des Tests zu ändern.n1,n2,n3Σ

(σ12/n1,σ22/n2,σ32/n3),
σk2k=1,2,3

Wenn andererseits Ihre alternative Hypothese ist, wird Ihre Nullhypothese zu Dies ist nicht sehr betriebsbereit. Denken Sie daran, dass unsere neue alternative Hypothese als so dass Ich weiß nicht, ob es dafür einen speziellen Test gibt, aber Sie können definitiv eine Strategie ausprobieren, die auf aufeinanderfolgenden Tests basiert. Denken Sie daran, dass Sie versuchen, Beweise gegen die Null zu finden. Sie können also zuerst und dann Wenn Sie beide Male ablehnen dann haben Sie Beweise dafür gefunden, dass

H12:μ1<μ2<μ3
H02:NOT H1.
H1:Aμ<0
H02:there exists a k=1,2 such that (Aμ)k0.
H0,12:(Aμ)10.
H0,22:(Aμ)20.
H0ist falsch und Sie lehnen . Wenn Sie dies nicht tun, lehnen Sie nicht ab . Da Sie mehrmals testen, müssen Sie den Nennpegel des Subtests anpassen. Sie können eine Bonferroni-Korrektur verwenden oder eine genaue Korrektur herausfinden (da Sie ).H0H0Σ

Eine andere Möglichkeit, einen Test für zu besteht darin, zu beachten, dass Dies impliziert die Verwendung von als Teststatistik. Der Test hat eine nicht standardmäßige Verteilung unter Null, aber der entsprechende kritische Wert sollte immer noch recht einfach zu berechnen sein.H02

H02:maxk=1,2(Aμ)k0.
maxAx

Andreas Dzemski
quelle
Fair genug, ich habe meine Antwort bearbeitet.
Andreas Dzemski
Gute Antwort (+1). Um es ein bisschen weiter zu verbessern, kann ich empfehlen, durch ersetzen , damit die Notation die Absicht widerspiegelt, dass dieses Objekt ein Schätzer für . & mgr; & mgr;xμ^μ
Ben - Reinstate Monica
1

Die Antwort von @ andreas-dzemski ist nur dann richtig, wenn wir wissen, dass die Daten normal verteilt sind.

Wenn wir die Verteilung nicht kennen, ist es meiner Meinung nach besser, einen nichtparametrischen Test durchzuführen. In diesem Fall scheint der einfachste einen Permutationstest durchzuführen. Dies ist ein Buch über das Thema und dies ist eine schöne Online-Erklärung. Unten füge ich R-Code hinzu, um diesen Test zu berechnen.

# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))

# sample with replacement
resample <- function(X) sample(X, replace=TRUE)

# return true if mu1 < mu2 < mu3
test     <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)

# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))
Scaramouche
quelle