Überprüfung der ANOVA-Annahmen

16

Vor ein paar Monaten habe ich eine Frage zu Homoskedastizitätstests in R auf SO gestellt, und Ian Fellows hat darauf geantwortet (ich werde seine Antwort sehr lose umschreiben):

Homoskedastizitätstests sind kein gutes Werkzeug, um die Passgenauigkeit Ihres Modells zu testen. Bei kleinen Stichproben haben Sie nicht genug Strom, um Abweichungen von der Homoskedastizität zu erkennen, während Sie bei großen Stichproben "viel Strom" haben, so dass Sie mit größerer Wahrscheinlichkeit auch geringfügige Abweichungen von der Gleichheit überprüfen.

Seine großartige Antwort war ein Schlag in mein Gesicht. Ich habe jedes Mal, wenn ich ANOVA durchführte, die Normalitäts- und Homoskedastizitätsannahmen überprüft.

Was ist Ihrer Meinung nach die beste Vorgehensweise bei der Überprüfung von ANOVA-Annahmen?

aL3xa
quelle

Antworten:

11

In angewendeten Einstellungen ist es in der Regel wichtiger zu wissen, ob ein Verstoß gegen Annahmen problematisch für den Rückschluss ist.

Annahmetests, die auf Signifikanztests basieren, sind für große Stichproben selten von Interesse, da die meisten Inferenztests robust gegenüber leichten Verstößen gegen Annahmen sind.

Eine der schönen Eigenschaften der grafischen Bewertung von Annahmen ist, dass sie die Aufmerksamkeit auf den Grad der Verletzung und nicht auf die statistische Signifikanz einer Verletzung lenken.

Es ist jedoch auch möglich, sich auf numerische Zusammenfassungen Ihrer Daten zu konzentrieren, die den Grad der Verletzung von Annahmen und nicht die statistische Signifikanz (z. B. Skewness-Werte, Kurtosis-Werte, Verhältnis der größten zu den kleinsten Gruppenvarianzen usw.) quantifizieren. Sie können auch Standardfehler oder Konfidenzintervalle für diese Werte erhalten, die bei größeren Stichproben kleiner werden. Diese Perspektive steht im Einklang mit der allgemeinen Vorstellung, dass statistische Signifikanz nicht gleichbedeutend mit praktischer Bedeutung ist.

Jeromy Anglim
quelle
1
+1 für die großartige Antwort, die alles einschließt. Die Anwendung der genannten numerischen Verfahren wird in Tabachnik und Fidells Using Multivariate Statistics (für SPSS und SAS) ausführlich beschrieben : amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/… (Siehe jedoch die Erratas auf der begleitete Webseite)
Henrik
Nun, ich denke, Zusammenfassungen wie Schiefe und Kurtosis sind meistens von geringem Wert, da ihre Stichprobenvariation einfach zu groß ist. Man könnte sie jedoch durch L_skewness und L_kurtosis ersetzen.
kjetil b halvorsen
@kjetilbhalvorsen Ich denke, es hängt davon ab, mit welcher Art von Stichprobengröße Sie normalerweise arbeiten. Nach meiner Erfahrung sind Diagramme und Skewness-Statistiken sehr hilfreich, um die Verteilung der Daten zu verstehen.
Jeromy Anglim
@ Jeromy Anglim: OK. Dann haben Sie in der Regel sehr große Stichproben! Haben Sie versucht, Ihre Skewness / Kurtosis-Koeffizienten aufzuladen?
kjetil b halvorsen
9

Einige Diagramme sind in der Regel viel aufschlussreicher als der p-Wert bei einem Test auf Normalität oder Homoskedastizität. Zeichnen Sie beobachtete abhängige Variablen gegen unabhängige Variablen. Diagrammbeobachtungen gegen Anfälle. Zeichnen Sie Residuen gegen unabhängige Variablen. Untersuchen Sie alles, was auf diesen Plots seltsam aussieht. Wenn etwas nicht seltsam aussieht, würde ich mir keine Sorgen über einen signifikanten Test einer Annahme machen.

S. Kolassa - Setzen Sie Monica wieder ein
quelle
Meistens ein guter Rat, aber was ist mit großen Datenmengen, bei denen Sie nicht alle Daten manuell durchsuchen können?
Dsimcha
1
n1n2<ασ2
2
@dsimcha re große Datensätze: hängt davon ab, was Sie mit "groß" meinen. Viele Beobachtungen? Verwenden Sie gute Grafiken (Boxplot, Jittered Dotplots, Sonnenblumenplots). Viele unabhängige Variablen? Ja, da haben Sie Recht ... Aber wenn Sie so viele IVs haben, dass Sie die DV nicht für jede IV zeichnen können, würde ich die Verwendung einer ANOVA in Frage stellen - es sieht so aus, als ob es in keiner schwer zu interpretieren ist Fall. Einige intelligente Ansätze des maschinellen Lernens sind möglicherweise besser (Brian D. Ripley: "Provokativ
ausgedrückt
Guter Kommentar, +1. Obwohl es sich bei dieser speziellen Frage um eine ANOVA handelt, habe ich mich beim Verfassen meiner Antwort allgemeiner mit der Frage beschäftigt, ob es sich um Diagramme oder um Tests handelt.
Dsimcha
4

Es gibt einige sehr gute Web-Anleitungen, um die Annahmen von ANOVA zu überprüfen und was zu tun ist, wenn dies fehlschlägt. Hier ist einer. Das ist ein anderer.

Grundsätzlich ist Ihr Auge der beste Richter, machen Sie also eine explorative Datenanalyse . Das heißt, zeichnen Sie die Daten - Histogramme und Box-Plots sind ein guter Weg, um Normalität und Homoskepsis zu bewerten. Und denken Sie daran, ANOVA ist robust gegenüber geringfügigen Verstößen.

Thylacoleo
quelle
4

QQ-Diagramme sind ziemlich gute Methoden, um Nicht-Normalitäten zu erkennen.

Bei Homoskedastizität sollten Sie den Levene-Test oder einen Brown-Forsythe-Test durchführen. Beide sind ähnlich, obwohl BF etwas robuster ist. Sie reagieren weniger empfindlich auf Nicht-Normalität als Bartletts Test, aber ich habe trotzdem festgestellt, dass sie bei kleinen Stichprobengrößen nicht die zuverlässigste sind.

QQ Handlung

Brown-Forsythe-Test

Levene's Test

Christopher Aden
quelle
Diagramme mit relativer Verteilung (oder im Vergleich zur Normalverteilung) könnten ein guter Ersatz sein, da ihre Interpretation für Anfänger klarer sein könnte.
kjetil b halvorsen
3

Ich stimme anderen zu, dass Signifikanztests für Annahmen problematisch sind.

kk

Semiparametrische (Rang-) Methoden wie der Wilcoxon- und der Kruskal-Wallis-Test treffen weitaus weniger Annahmen. Das ECDF-Protokoll sollte für Wilcoxon-Kruskal-Wallis-Tests mit maximaler Leistung parallel sein (Fehler vom Typ I sind für sie nie ein Problem). Linearität ist nicht erforderlich. Rank-Tests machen Annahmen darüber, wie Verteilungen verschiedener Gruppen zu anderen in Beziehung stehen, aber machen keine Annahmen über die Form einer Verteilung.

Frank Harrell
quelle