Testen eines großen Datensatzes auf Normalität - wie und ist er zuverlässig?

12

Ich untersuche einen Teil meines Datensatzes mit 46840 Doppelwerten zwischen 1 und 1690, die in zwei Gruppen zusammengefasst sind. Um die Unterschiede zwischen diesen Gruppen zu analysieren, habe ich zunächst die Verteilung der Werte untersucht, um den richtigen Test auszuwählen.

Nach einer Anleitung zum Testen auf Normalität habe ich ein qqplot, ein Histogramm und ein Boxplot erstellt.

Geben Sie hier die Bildbeschreibung ein

Geben Sie hier die Bildbeschreibung ein Geben Sie hier die Bildbeschreibung ein

Dies scheint keine Normalverteilung zu sein. Da der Leitfaden etwas richtig angibt, dass eine rein grafische Prüfung nicht ausreicht, möchte ich auch die Verteilung auf Normalität testen.

Wie sollte angesichts der Größe des Datensatzes und der Einschränkung des Shapiro-Wilks-Tests in R die gegebene Verteilung auf Normalität und unter Berücksichtigung der Größe des Datensatzes getestet werden? Ist dies überhaupt zuverlässig? ( Siehe akzeptierte Antwort auf diese Frage )

Bearbeiten:

Die Einschränkung des Shapiro-Wilk-Tests, auf den ich mich beziehe, besteht darin, dass der zu testende Datensatz auf 5000 Punkte begrenzt ist. Um eine weitere gute Antwort zu diesem Thema zu zitieren :

Ein weiteres Problem beim Shapiro-Wilk-Test ist, dass die Wahrscheinlichkeit, dass die Nullhypothese abgelehnt wird, größer wird, wenn Sie mehr Daten eingeben. Was also passiert, ist, dass für große Datenmengen sogar sehr kleine Abweichungen von der Normalität festgestellt werden können, was zur Ablehnung des Nullhypothesenereignisses führt, obwohl die Daten für praktische Zwecke mehr als normal genug sind.

[...] Glücklicherweise schützt Shapiro.test den Benutzer vor dem oben beschriebenen Effekt, indem die Datengröße auf 5000 begrenzt wird.

Warum teste ich überhaupt auf Normalverteilung:

Einige Hypothesentests gehen von einer Normalverteilung der Daten aus. Ich möchte wissen, ob ich diese Tests verwenden kann oder nicht.

deemel
quelle
11
Es macht keinen Sinn zu testen; Jeder Test jeglicher Verwendung, ein vernünftiges Signifikanzniveau wird eindeutig abgelehnt. Welchen Leitfaden Sie auch lesen, hat Sie in die Irre geführt. Was genau meinst du mit "zuverlässig"? Auf welche "Einschränkung" des Shapiro-Wilk beziehen Sie sich? Ich würde der Aussage in der Antwort, auf die Sie verweisen, beinahe zustimmen ... "Ich bin noch nie auf eine Situation gestoßen, in der ein normaler Test das Richtige ist" (ich habe mindestens einmal eine Situation gesehen, in der ich denke, dass es die ist das Richtige, aber die Leute tun es fast immer aus schlechten Gründen.
Glen_b -Reinstate Monica
@Glen_b: Übrigens habe ich neulich Shapiro-Wilk verwendet , um die Beweise gegen die Null zu quantifizieren, die jemand von Academia fälschlicherweise als größer angenommen hatte als aus einer Stichprobe von Noten. Ich frage mich, ob das eine vertretbare Verwendung war.
Nick Stauner
@NickStauner Meine Antwort wurde viel zu lang für einen einzelnen Kommentar und ich möchte diese Frage nicht mit einer Reihe von Kommentaren zu Ihrem Beitrag dort entführen. Möglichkeiten: Wir unterhalten uns im Chat, oder Sie stellen eine Frage dazu (auf die ich eine ausführliche Antwort geben könnte), oder wir diskutieren sie auf andere Weise, z. B. per E-Mail.
Glen_b -Rate State Monica

Antworten:

14

Ich verstehe nicht, warum Sie sich die Mühe machen würden. Es ist eindeutig nicht normal - in diesem Fall erscheint mir eine grafische Prüfung ausreichend. Sie haben viele Beobachtungen von einer scheinbar schönen, sauberen Gammaverteilung. Mach einfach mit. es, wenn Sie müssen - ich werde eine Referenzverteilung empfehlen.

x=rgamma(46840,2.13,.0085);qqnorm(x);qqline(x,col='red')
Geben Sie hier die Bildbeschreibung ein

hist(rgamma(46840,2.13,.0085))

boxplot(rgamma(46840,2.13,.0085))

Wie ich immer sage: "Siehe Ist Normalitätstests 'im Wesentlichen nutzlos'? ", Insbesondere die Antwort von @ MånsT , in der darauf hingewiesen wird, dass unterschiedliche Analysen unterschiedliche Empfindlichkeiten für unterschiedliche Verstöße gegen Normalitätsannahmen aufweisen. Wenn Ihre Verteilung so nah an meiner liegt, wie es aussieht, haben Sie wahrscheinlich einen Versatz1.4 und Kurtosis 5.9 ("überschüssige Kurtosis" 2.9). Das kann bei vielen Tests ein Problem sein. Wenn Sie nicht einfach einen Test mit angemesseneren oder gar keinen parametrischen Annahmen finden können, können Sie möglicherweise Ihre Daten transformieren oder zumindest eine Sensitivitätsanalyse der von Ihnen beabsichtigten Analyse durchführen.

Nick Stauner
quelle