Vor ein paar Monaten habe ich eine Frage zu Homoskedastizitätstests in R auf SO gestellt, und Ian Fellows hat darauf geantwortet (ich werde seine Antwort sehr lose umschreiben):
Homoskedastizitätstests sind kein gutes Werkzeug, um die Passgenauigkeit Ihres Modells zu testen. Bei kleinen Stichproben haben Sie nicht genug Strom, um Abweichungen von der Homoskedastizität zu erkennen, während Sie bei großen Stichproben "viel Strom" haben, so dass Sie mit größerer Wahrscheinlichkeit auch geringfügige Abweichungen von der Gleichheit überprüfen.
Seine großartige Antwort war ein Schlag in mein Gesicht. Ich habe jedes Mal, wenn ich ANOVA durchführte, die Normalitäts- und Homoskedastizitätsannahmen überprüft.
Was ist Ihrer Meinung nach die beste Vorgehensweise bei der Überprüfung von ANOVA-Annahmen?
Einige Diagramme sind in der Regel viel aufschlussreicher als der p-Wert bei einem Test auf Normalität oder Homoskedastizität. Zeichnen Sie beobachtete abhängige Variablen gegen unabhängige Variablen. Diagrammbeobachtungen gegen Anfälle. Zeichnen Sie Residuen gegen unabhängige Variablen. Untersuchen Sie alles, was auf diesen Plots seltsam aussieht. Wenn etwas nicht seltsam aussieht, würde ich mir keine Sorgen über einen signifikanten Test einer Annahme machen.
quelle
Es gibt einige sehr gute Web-Anleitungen, um die Annahmen von ANOVA zu überprüfen und was zu tun ist, wenn dies fehlschlägt. Hier ist einer. Das ist ein anderer.
Grundsätzlich ist Ihr Auge der beste Richter, machen Sie also eine explorative Datenanalyse . Das heißt, zeichnen Sie die Daten - Histogramme und Box-Plots sind ein guter Weg, um Normalität und Homoskepsis zu bewerten. Und denken Sie daran, ANOVA ist robust gegenüber geringfügigen Verstößen.
quelle
QQ-Diagramme sind ziemlich gute Methoden, um Nicht-Normalitäten zu erkennen.
Bei Homoskedastizität sollten Sie den Levene-Test oder einen Brown-Forsythe-Test durchführen. Beide sind ähnlich, obwohl BF etwas robuster ist. Sie reagieren weniger empfindlich auf Nicht-Normalität als Bartletts Test, aber ich habe trotzdem festgestellt, dass sie bei kleinen Stichprobengrößen nicht die zuverlässigste sind.
QQ Handlung
Brown-Forsythe-Test
Levene's Test
quelle
Ich stimme anderen zu, dass Signifikanztests für Annahmen problematisch sind.
Semiparametrische (Rang-) Methoden wie der Wilcoxon- und der Kruskal-Wallis-Test treffen weitaus weniger Annahmen. Das ECDF-Protokoll sollte für Wilcoxon-Kruskal-Wallis-Tests mit maximaler Leistung parallel sein (Fehler vom Typ I sind für sie nie ein Problem). Linearität ist nicht erforderlich. Rank-Tests machen Annahmen darüber, wie Verteilungen verschiedener Gruppen zu anderen in Beziehung stehen, aber machen keine Annahmen über die Form einer Verteilung.
quelle