Ich möchte feststellen, ob die Verwendung eines Mehrfachvergleichstests für meine Daten geeignet ist. Ich habe den Kruskal-Wallis-Test verwendet, um festzustellen, ob es Unterschiede in der mittleren Hemmung zwischen verschiedenen Gruppen gibt. Die Analyse ergab, dass es signifikante Unterschiede gab, und jetzt möchte ich ein Mehrfachvergleichsverfahren (möglicherweise Dunns, da ich ungleiche Stichprobengrößen habe) verwenden, um festzustellen, welche Gruppen sich von den anderen unterscheiden.
Ich habe mich gefragt, ob ich viele Gruppen habe ( ). Würde dies dazu führen, dass ein Test mit mehreren Vergleichen nur eine sehr geringe Leistung hat oder für diesen Datensatz nicht geeignet ist?
Antworten:
Gute Frage! Lassen Sie uns zunächst mögliche Verwirrung beseitigen. Dunns Test (Dunn, 1964) ist genau das: Eine Teststatistik, die ein nichtparametrisches Analogon zum paarweisen t- Test ist, den man post hoc zu einer ANOVA durchführen würde. Es ähnelt dem Mann-Whitney-Wilcoxon-Rangsummentest, mit der Ausnahme, dass (1) ein Maß für die gepoolte Varianz verwendet wird, das durch die Nullhypothese des Kruskal-Wallis-Tests impliziert wird, und (2) dasselbe Ranking verwendet wird der ursprünglichen Daten, wie sie im Kruskal-Wallis-Test verwendet werden.
Andere Methoden zur Steuerung der FWER existieren jedoch mit mehr statistischer Leistung. Zum Beispiel haben die schrittweisen Holm- und Holm-Sidak-Methoden (Holm, 1979) keine Blutungskraft wie die Bonferroni-Methode. Auch dort konnte man darauf abzielen , die steuern falschen Fündigkeitsquote (FDR) statt, und diese Methoden-Benjamini-Hochberg (1995) und Benjamini-Yekutieli (2001) -generally mehr statistische Aussagekraft geben , indem angenommen wird, dass einige Nullhypothesen sind falsch (dh indem die Idee, dass nicht alle Ablehnungen falsche Ablehnungen sind, in sequentiell modifizierte Ablehnungskriterien umgewandelt wird). Diese und andere Anpassungen für mehrere Vergleiche werden speziell für Dunns Test in Stata im Dunntest- Paket (innerhalb des Stata-Typs) implementiert
net describe dunntest, from(https://alexisdinno.com/stata)
) und in R im Paket dunn.test .Darüber hinaus gibt es eine Alternative zu Dunns Test (der auf einer ungefähren z- Teststatistik basiert ): den Conover-Iman (ausschließlich) post hoc zu einem abgelehnten Kruskal-Wallis-Test (der auf einer t- Verteilung basiert und der ist) stärker als Dunns Test; Conover & Iman, 1979; Convover, 1999). Sie können die Methoden auch verwenden, um die FWER oder den FDR mit den Conover-Iman-Tests zu steuern, die für Stata im conovertest- Paket (innerhalb des Stata-Typs
net describe conovertest, from(https://alexisdinno.com/stata)
) und für R im conover.test- Paket implementiert sind.Verweise
Benjamini, Y. und Hochberg, Y. (1995). Kontrolle der Rate falscher Entdeckungen: Ein praktischer und leistungsfähiger Ansatz für mehrere Tests . Zeitschrift der Royal Statistical Society . Serie B (methodisch), 57 (1): 289–300.
Benjamini, Y. und Yekutieli, D. (2001). Die Kontrolle der Falscherkennungsrate bei mehreren Tests in Abhängigkeit . Annals of Statistics , 29 (4): 1165–1188.
Conover, WJ (1999). Praktische nichtparametrische Statistik . Wiley, Hoboken, NJ, 3. Auflage.
Conover, WJ und Iman, RL (1979). Bei Verfahren mit mehreren Vergleichen . Technischer Bericht LA-7677-MS, Wissenschaftliches Labor Los Alamos.
Dunn, ABl. (1961). Mehrere Vergleiche zwischen Mitteln . Journal of the American Statistical Association , 56 (293): 52–64.
Dunn, ABl. (1964). Mehrere Vergleiche mit Rangsummen . Technometrics , 6 (3): 241–252.
Holm, S. (1979). Ein einfaches, nacheinander ablehnendes Mehrfachtestverfahren . Scandinavian Journal of Statistics , 6 (65-70): 1979.
quelle