Warum Levene-Test der Varianzgleichheit anstelle des F-Verhältnisses?

Antworten:

34

Sie können einen F-Test verwenden, um die Varianz von zwei Gruppen zu bewerten. Wenn Sie jedoch F zum Testen auf Varianzunterschiede verwenden, müssen die Verteilungen unbedingt normal sein. Die Verwendung des Levene-Tests (dh der absoluten Werte der Abweichungen vom Mittelwert) ist robuster, und die Verwendung des Brown-Forsythe-Tests (dh der absoluten Werte der Abweichungen vom Median ) ist noch robuster. SPSS verfolgt hier einen guten Ansatz.

Update Als Antwort auf den Kommentar unten möchte ich klarstellen, was ich hier sagen möchte. Bei der Frage geht es darum, "ein einfaches F-Verhältnis des Verhältnisses der Varianzen der beiden Gruppen" zu verwenden. Von hier aus verstand ich die Alternative als den sogenannten Hartley-Test , einen sehr intuitiven Ansatz zur Beurteilung der Varianzheterogenität. Obwohl hier ein Varianzverhältnis verwendet wird, ist es nicht dasselbe, das im Levene-Test verwendet wurde. Da es manchmal schwer zu verstehen ist, was gemeint ist, wenn es nur in Worten ausgedrückt wird, werde ich Gleichungen geben, um dies klarer zu machen.

Hartleys Test: Test / Brown-Forsythe-Test:

F=s22s12
F=MSb/t-levelsMSw/ich-levels

In allen drei Fällen haben wir Varianzverhältnisse, aber die spezifischen Varianzen unterscheiden sich zwischen ihnen. Der Levene-Test und der Brown-Forsythe-Test sind robuster (und unterscheiden sich auch von anderen ANOVA-Tests), da sie über transformierte Daten durchgeführt werden, während das F-Verhältnis der Gruppenvarianzen (Hartley-Test) die Rohdaten verwendet. Die fraglichen transformierten Daten sind die absoluten Werte der Abweichungen (vom Mittelwert im Falle des Levene-Tests und vom Median im Falle des Brown-Forsythe-Tests).

Es gibt andere Tests für die Heterogenität der Varianz, aber ich beschränke meine Diskussion auf diese, da ich verstehe, dass sie im Mittelpunkt der ursprünglichen Frage stehen. Der Grund für die Auswahl unter ihnen basiert auf ihrer Leistung, wenn die ursprünglichen Daten nicht wirklich normal sind. wobei der F-Test nicht robust genug ist, um nicht empfohlen zu werden; Levenes Test ist etwas leistungsfähiger als BF, wenn die Daten wirklich normal sind, aber nicht ganz so robust, wenn sie es nicht sind. Das Hauptzitat hier ist O'Brien (1981), obwohl ich im Internet keine verfügbare Version finden konnte. Ich entschuldige mich, wenn ich die Frage falsch verstanden habe oder unklar war.

gung - Wiedereinsetzung von Monica
quelle
2
Da die Levene-Statistik ein Verhältnis der Quadrate ist, die aus diesen absoluten Residuen gebildet werden, und auf eine F-Verteilung bezogen wird, ist nicht sofort ersichtlich, dass sie robuster sein sollte als andere Tests, die auf Verhältnissen der Quadrate basieren! Möglicherweise denken Sie an robustere Varianten wie den Brown-Forsythe-Test . Eine gute Diskussion von @chl finden Sie unter stats.stackexchange.com/questions/2591/… .
Whuber
@whuber, danke für den Kommentar & Link. Da ein Kommentar zu viele Antworten enthält, habe ich meine Antwort bearbeitet. Ich glaube, was ich zu erreichen versuche, sollte jetzt klarer sein. Wenn ich jedoch falsch verstanden habe oder mich einfach irre, kann ich diese Antwort löschen.
gung - Wiedereinsetzung von Monica
Der (neue) letzte Absatz macht Ihren Punkt gut (+1).
whuber