Interpretation des Shapiro-Wilk-Tests

29

Ich bin ziemlich neu in der Statistik und brauche deine Hilfe.
Ich habe eine kleine Auswahl wie folgt:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

Ich habe den Shapiro-Wilk-Test mit R durchgeführt:

shapiro.test(precisionH4U$H4U)

und ich habe folgendes Ergebnis erhalten:

 W = 0.9502, p-value = 0.6921

Wenn ich nun annehme, dass das Signifikanzniveau bei 0,05 größer ist als der p-Wert, dann ist Alpha (0,6921> 0,05) und ich kann die Nullhypothese über die Normalverteilung nicht verwerfen, aber erlaubt es mir zu sagen, dass die Stichprobe eine Normalverteilung hat ?

Vielen Dank!

Jakub
quelle

Antworten:

28

Nein - Sie können nicht "die Stichprobe hat eine Normalverteilung" oder "die Stichprobe stammt aus einer Population mit einer Normalverteilung" sagen, sondern nur "Sie können die Hypothese, dass die Stichprobe aus einer Population mit einer Normalverteilung stammt, nicht ablehnen".

Tatsächlich weist das Beispiel keine Normalverteilung auf (siehe den folgenden QQ-Plot ), aber Sie würden nicht damit rechnen, da es sich nur um ein Beispiel handelt. Die Frage nach der Verteilung der Grundgesamtheit bleibt offen.

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot

Henry
quelle
2
das qqplot sieht ziemlich normal aus, denke ich ... du kannst es qqnorm(rnorm(9))mehrmals versuchen ...
Curious
2
@Tomas: Vielleicht besser zu sagen "Der qqplot sieht so aus, als ob er aus einer normalen Population stammen könnte". Es könnte stattdessen von einer Distribution mit schwereren Schwänzen stammen.
Henry
Ja, qqnorm(runif(9))kann zu ähnlichen Ergebnissen führen. Also können wir eigentlich nichts sagen ...
Neugierig
Was ist der Unterschied zwischen "Die Stichprobe hat eine Normalverteilung" und "Die Stichprobe stammt aus einer Population mit einer Normalverteilung"?
Auraham
1
Eine Normalverteilung ist eine kontinuierliche Verteilung über alle Wirklichkeiten. Eine Stichprobe (endlich oder sogar unendlich) kann diese Art von Verteilung selbst nicht haben, selbst wenn sie aus einer Population mit dieser Verteilung stammt.
Henry
17

Wenn Sie eine Nullhypothese nicht ablehnen, ist dies ein Hinweis darauf, dass Ihre Stichprobe zu klein ist, um eventuelle Abweichungen von der Normalität zu erfassen. Ihre Stichprobe ist jedoch so klein, dass selbst ganz erhebliche Abweichungen von der Normalität wahrscheinlich nicht erkannt werden.

Ein Hypothesentest ist jedoch in den meisten Fällen so gut wie unbrauchbar, weil - Sie wissen tatsächlich, welche Antwort auf die zu testende Frage Sie haben - die Verteilung der Grundgesamtheit aus Ihren gezogenen Daten nicht normal sein wird . (Es mag manchmal ziemlich eng sein, aber eigentlich normal?)

Die Frage, um die Sie sich kümmern sollten, ist nicht "Ist die Verteilung, aus der sie gezogen werden" (wird es nicht sein). Die Frage, um die Sie sich eigentlich kümmern sollten, lautet eher: "Wird sich die Abweichung von der Normalität wesentlich auf meine Ergebnisse auswirken?". Wenn dies möglicherweise ein Problem ist, können Sie eine Analyse in Betracht ziehen, bei der dieses Problem mit geringerer Wahrscheinlichkeit auftritt.

Glen_b - Setzen Sie Monica wieder ein
quelle
10

In Anbetracht dessen, dass Sie in der Statistik ziemlich neu sind, vermute ich, dass Sie darüber nachdenken, da dies Reste einer Schätzung eines Mittelwerts sind und Sie wissen möchten, ob die Annahme der Normalität für Konfidenzschätzungen unter Verwendung einer Verteilung gültig ist .t

t Tests sind sehr robust gegenüber Verstößen gegen diese Annahme, die Daten in Henrys qq-Diagramm sehen vage normal aus, und der Shapiro-Test zeigt nicht an, dass die Daten aus einer Population mit einer nicht normalen Verteilung stammen. Ich würde also sagen, dass a test ist angebracht.t

Ich spekuliere außerdem, dass Sie Proportionen betrachten. In diesem Fall könnten Sie eine Binomialverteilung verwenden, wenn Sie Bedenken wegen Verstößen gegen Annahmen haben.

Wenn es eine andere Sorge war, die Sie zu Shapiro-Tests brachte, können Sie alles, was ich gerade sagte, ignorieren.

Thomas Levine
quelle
Sie haben es richtig verstanden, ich wollte wissen, ob ich t für meine Probe testen kann. Vielen Dank!
Jakub
4

Wie Henry schon sagte, kann man nicht sagen, dass es normal ist. Versuchen Sie einfach, den folgenden Befehl mehrmals in R auszuführen:

shapiro.test(runif(9)) 

Dadurch wird die Stichprobe von 9 Zahlen aus der Gleichverteilung getestet. Oft ist der p-Wert viel größer als 0,05 - was bedeutet, dass Sie nicht darauf schließen können, dass die Verteilung normal ist.

Neugierig
quelle
4

Ich habe mir auch überlegt, wie man den W- Wert im Shapiro-Wilk-Test richtig interpretiert, und laut Emil OW Kirkegaards Artikel " W-Werte aus dem Shapiro-Wilk-Test, dargestellt mit verschiedenen Datensätzen " ist es sehr schwierig, etwas über die Normalität von a zu sagen Verteilung auf W- Wert allein suchen .

Wie er abschließend feststellt:

Im Allgemeinen sehen wir, dass SW bei einer großen Stichprobe empfindlich auf Abweichungen von der Normalität reagiert. Wenn die Abfahrt jedoch sehr klein ist, ist dies nicht sehr wichtig.

Wir sehen auch, dass es schwierig ist, den W-Wert zu verringern, selbst wenn man es absichtlich versucht. Man muss eine extrem ungewöhnliche Verteilung testen, damit sie deutlich unter 0,99 fällt.

Weitere Informationen finden Sie im Originalartikel.

Denis Rasulev
quelle
1

Ein wichtiges Problem, das in der vorherigen Antwort nicht erwähnt wurde, sind die Testeinschränkungen:

Der Test weist Einschränkungen auf, insbesondere, dass der Test eine Abweichung von der Stichprobengröße aufweist . Je größer die Stichprobe ist, desto wahrscheinlicher ist es, dass Sie ein statistisch signifikantes Ergebnis erhalten.

Zur Beantwortung der ursprünglichen Frage (sehr kleine Stichprobengröße): In den folgenden Artikeln finden Sie Informationen zu besseren Alternativen wie QQ-Plot und Histogramm für diesen speziellen Fall.

Stenemo
quelle