Wikipedia sagt
Methoden, die auf einem Omnibus-Test beruhen, bevor mehrere Vergleiche durchgeführt werden . Typischerweise erfordern diese Methoden einen signifikanten ANOVA / Tukey-Bereichstest, bevor mehrere Vergleiche durchgeführt werden. Diese Methoden haben eine "schwache" Kontrolle des Fehlers vom Typ I.
Der F-Test in ANOVA ist ein Beispiel für einen Omnibus-Test, der die Gesamtsignifikanz des Modells testet. Ein signifikanter F-Test bedeutet, dass sich unter den getesteten Mitteln mindestens zwei der Mittel signifikant unterscheiden, aber dieses Ergebnis gibt nicht genau an, welche Mittel sich voneinander unterscheiden. Tatsächlich wurden durch die quadratische rationale F-Statistik (F = MSB / MSW) Unterschiede zwischen Testmitteln festgestellt. Um festzustellen, welcher Mittelwert sich von einem anderen Mittelwert unterscheidet oder welcher Mittelwertkontrast sich signifikant unterscheidet, sollten Post-Hoc-Tests (Mehrfachvergleichstests) oder geplante Tests durchgeführt werden, nachdem ein signifikanter Omnibus-F-Test erhalten wurde. Es kann in Betracht gezogen werden, die einfache Bonferroni-Korrektur oder eine andere geeignete Korrektur zu verwenden.
Daher wird ein Omnibus-Test verwendet, um die Gesamtsignifikanz zu testen, während durch Mehrfachvergleich ermittelt wird, welche Unterschiede signifikant sind.
Wenn ich das richtig verstehe, besteht der Hauptzweck des Mehrfachvergleichs darin, die Gesamtsignifikanz zu testen und festzustellen, welche Unterschiede signifikant sind. Mit anderen Worten, Mehrfachvergleiche können das tun, was ein Omnibus kann. Warum brauchen wir dann einen Omnibus-Test?
Ein Omnibus-Test ist normalerweise ein Name zum Testen der globalen Nullhypothese. Eine absolute Mindestanforderung für ein Mehrfachtestverfahren ist die Fehlerkontrolle unter der globalen Null. Dies ist als "schwache FWER" -Kontrolle bekannt. Aber Sie werden wahrscheinlich nicht damit aufhören - um auf bestimmte Hypothesen schließen zu können, möchten Sie ein Verfahren, das FWER-Kontrolle unter einer beliebigen Kombination von echten Nullen bietet. Dies ist als "starke FWER" -Kontrolle bekannt.
quelle
Zusätzlich zu den Berechnungen, die mit Pair-Wise-Tests verbunden sind, gibt es noch einen weiteren Grund, warum ANOVA verwendet wird, anstatt alle PAIR-WISE-Tests durchzuführen.
Manchmal ist es möglich, dass ANOVA zwar die Nullhypothese ablehnt, dass alle Populationsmittelwerte bei einem gewissen Konfidenzniveau gleich sind, aber wenn Sie alle paarweisen Tests (z. B. LSD) durchführen, finden Sie möglicherweise nicht einmal mindestens ein Mittelwertpaar überschreitet den Unterschied bei diesem Konfidenzniveau.
Mathematischer Beweis für die obige Aussage unter Berücksichtigung der paarweisen LSD-Tests von FISHER
Selbst wenn alle paarweisen LSD-Tests zusammen die Nullhypothesen nicht ablehnen können, besteht dennoch eine gute Chance, dass ANOVA die Nullhypothesen ablehnen kann.
Daher enthält ANOVA mehr Informationen als in allen paarweisen Tests, die zusammen betrachtet werden.
PS: Entschuldigung für die Verwendung des Bildes, anstatt die Gleichungen auszutippen.
quelle