Angenommen, ich habe ein Experiment mit zwei oder mehr Faktoren. Es wird eine Gesamt-ANOVA erstellt, und anschließend werden zwei oder mehr Sätze von Post-hoc- Tests durchgeführt, beispielsweise mehrere Vergleiche. Meine Frage ist, wie groß --- und wie viele --- Familien als Grundlage für die Multiplizitätsanpassungen dieser Post-hoc- Tests verwendet werden sollten.
Ein Beispiel ist der Warp-Breaks-Datensatz aus Tukeys EDA-Buch. Es gibt zwei Faktoren: wool
(auf zwei Ebenen) und tension
(auf drei Ebenen). Die ANOVA-Tabelle lautet:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Es ist klar, dass die Interaktion im Modell benötigt wird. Wir beschließen daher, die Niveaus der einzelnen Faktoren zu vergleichen und den anderen Faktor festzuhalten. Die Ergebnisse sind unten aufgeführt, wobei einige Anmerkungen später aufgeführt werden:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Ich denke, es gibt verschiedene Praktiken, und ich frage mich, welche am häufigsten vorkommen und welche Argumente die Leute für oder gegen jeden Ansatz vorbringen würden. Sollten wir bei der Berechnung angepasster Werte Multiplizitätsanpassungen für ...
- jede der fünf kleinsten Familien (T | A, T | B, ..., W | H) separat? (Hinweis - Die letzten 3 Familien haben nur einen Test, daher gibt es für diese keine Multiplizitätsanpassung.)
- jede der größeren Familien (T, mit 6 Tests und W, mit 3 Tests) separat?
- alle Tests als eine große Familie betrachtet?
Ich interessiere mich sowohl dafür, was die Leute normalerweise tun (auch wenn sie nicht viel darüber nachgedacht haben) als auch warum (wenn sie es getan haben). Ein paar Dinge, die ich erwähnen könnte, sind:
- Die ANOVA-Tabelle enthält 3 Tests. Ich kann mich nicht erinnern, dass jemand eine Anpassung der Multiplizität bei ANOVA-Tests in Betracht gezogen hat. Wenn dies der Fall ist und Sie Option (3) empfehlen, sind Sie inkonsistent?
- Wenn wir ein etwas kleineres Experiment durchgeführt hätten, bei dem alle Tests weniger leistungsfähig sind, wäre die Interaktion möglicherweise nicht signifikant gewesen, was zu einer viel geringeren Anzahl von Post-hoc- Vergleichen nur von Randmitteln geführt hätte. Darüber hinaus könnten die Randmittel durchaus kleinere SEs aufweisen als die Zellmittel im größeren Experiment. Wenn außerdem die Multiplizitätsanpassung weniger konservativ ist, könnten wir mit weniger Daten "signifikantere" Ergebnisse erzielen als mit mehr Daten.
Interessiert zu sehen, was die Leute zu sagen haben ...
quelle
lsmeans
? Das war viel Arbeit für diese Frage!