Angewandte lineare statistische Modelle von Kutner et al. In Bezug auf Abweichungen von der Normalitätsannahme von ANOVA-Modellen heißt es: Die Kurtosis der Fehlerverteilung (entweder mehr oder weniger als eine Normalverteilung) ist im Hinblick auf die Auswirkungen auf Schlussfolgerungen wichtiger als die Schiefe der Verteilung .
Ich bin ein bisschen verwirrt über diese Aussage und habe es nicht geschafft, verwandte Informationen zu finden, weder im Buch noch online. Ich bin verwirrt, weil ich auch erfahren habe, dass QQ-Diagramme mit starken Schwänzen ein Hinweis darauf sind, dass die Normalitätsannahme für lineare Regressionsmodelle "gut genug" ist, wohingegen verzerrte QQ-Diagramme eher von Belang sind (dh eine Transformation könnte angebracht sein). .
Stimmt es, dass die gleiche Überlegung für ANOVA gilt und dass ihre Wortwahl ( wichtiger im Hinblick auf die Auswirkungen auf Schlussfolgerungen ) nur schlecht gewählt wurde? Das heißt, eine verzerrte Verteilung hat schwerwiegendere Konsequenzen und sollte vermieden werden, wohingegen eine geringe Menge an Kurtosis akzeptabel sein kann.
EDIT: Wie von rolando2 angesprochen, ist es schwer zu sagen, dass einer in allen Fällen wichtiger ist als der andere, aber ich suche nur nach einer allgemeinen Einsicht. Mein Hauptproblem ist, dass mir beigebracht wurde, dass bei einer einfachen linearen Regression QQ-Diagramme mit schwereren Schwänzen (= Kurtosis?) In Ordnung sind, da der F-Test dagegen ziemlich robust ist. Andererseits sind verzerrte QQ-Diagramme (parabelförmig) normalerweise ein größeres Problem. Dies scheint direkt gegen die Richtlinien zu verstoßen, die mein Lehrbuch für ANOVA vorsieht, obwohl ANOVA-Modelle in Regressionsmodelle konvertiert werden können und die gleichen Annahmen haben sollten.
Ich bin überzeugt, dass ich etwas übersehen habe oder eine falsche Annahme habe, aber ich kann nicht herausfinden, was es sein könnte.
Antworten:
Die Schwierigkeit ist, dass Schiefe und Kurtosis abhängig sind; ihre Wirkungen können nicht vollständig voneinander getrennt werden.
Das Problem ist, dass Sie auch eine Verteilung mit hoher Kurtosis haben müssen , wenn Sie den Effekt einer Verteilung mit hohem Versatz untersuchen möchten .
* (gewöhnliche skalierte Kurtosis im vierten Moment, nicht übermäßige Kurtosis)
Khan und Rayner (die in der vorherigen Antwort erwähnt wurden) arbeiten mit einer Familie zusammen, die eine Erforschung der Auswirkungen von Schiefe und Kurtosis ermöglicht, aber sie können dieses Problem nicht vermeiden, weshalb ihr Versuch, sie zu trennen, das Ausmaß der Wirkung von stark einschränkt Schiefe kann erkundet werden.
Wenn Sie zum Beispiel den Effekt einer hohen Schiefe sehen möchten - sagen Sie Schiefe> 5 -, können Sie bei einer Kurtosis von weniger als 26 keine Verteilung erhalten!
Wenn Sie also die Auswirkungen einer hohen Schräglage untersuchen möchten, können Sie es nicht vermeiden, die Auswirkungen einer hohen Kurtosis zu untersuchen. Wenn Sie also versuchen, sie zu trennen, sind Sie in der Tat nicht in der Lage, den Effekt einer Erhöhung der Schiefe auf ein hohes Maß zu bewerten.
Zumindest für die Vertriebsfamilie, die sie in Betracht zogen, und innerhalb der Grenzen, die die Beziehung zwischen ihnen aufzeigt, scheinen die Untersuchungen von Khan und Rayner jedoch darauf hinzudeuten, dass Kurtosis das Hauptproblem ist.
quelle
Dieses Problem wird von Khan und Rayner in "Robustheit gegenüber Nicht-Normalität von allgemeinen Tests für das Standortproblem mit vielen Stichproben" angesprochen .
Sie stellten fest, dass ANOVA-Tests wesentlich stärker von der Kurtosis als von der Schiefe betroffen sind und dass die Wirkung der Schiefe in keinem Zusammenhang mit ihrer Richtung steht.
Bei Verdacht auf Abweichungen von der Normalität ist der Kruskal-Wallis-Test möglicherweise die bessere Wahl. Kruskal-Wallis - Test ist robuster zu Abweichungen von der Normalität , weil es die Hypothese untersucht , dass die Behandlung Mediane identisch ist. ANOVA prüft die Hypothese , dass die Behandlungsmittel identisch sind.
quelle