Was ist der Unterschied zwischen dem Shapiro-Wilk-Normalitätstest und dem Kolmogorov-Smirnov-Normalitätstest? Wann werden sich die Ergebnisse dieser beiden Methoden unterscheiden?
Was ist der Unterschied zwischen dem Shapiro-Wilk-Normalitätstest und dem Kolmogorov-Smirnov-Normalitätstest? Wann werden sich die Ergebnisse dieser beiden Methoden unterscheiden?
Man kann die beiden nicht einmal wirklich vergleichen, da Kolmogorov-Smirnov für eine vollständig spezifizierte Verteilung ist (wenn Sie also die Normalität testen, müssen Sie den Mittelwert und die Varianz angeben; diese können aus den Daten nicht geschätzt werden *), während Der Shapiro-Wilk ist für Normalität mit nicht spezifiziertem Mittelwert und Varianz.
* Sie können auch nicht standardisieren, indem Sie geschätzte Parameter verwenden und auf Standardnormal testen. das ist eigentlich das gleiche.
Ein Vergleich wäre, den Shapiro-Wilk durch einen Test für einen bestimmten Mittelwert und eine Varianz in einer Normalen zu ergänzen (die Tests auf irgendeine Weise zu kombinieren) oder die KS-Tabellen für die Parameterschätzung anpassen zu lassen (aber dann ist es keine Verteilung mehr -frei).
Es gibt einen solchen Test (der dem Kolmogorov-Smirnov mit geschätzten Parametern entspricht) - den Lilliefors-Test; Die Normalitätstestversion kann mit der Shapiro-Wilk-Version verglichen werden (und hat im Allgemeinen eine geringere Leistung). Konkurrenzfähiger ist der Anderson-Darling-Test (der auch für die Parameterschätzung angepasst werden muss, damit ein Vergleich gültig ist).
Der KS-Test (und der Lilliefors-Test) untersuchen den größten Unterschied zwischen der empirischen CDF und der angegebenen Verteilung, während der Shapiro Wilk zwei Varianzschätzungen effektiv vergleicht. Die eng verwandte Shapiro-Francia kann als monotone Funktion der quadratischen Korrelation in einem QQ-Diagramm betrachtet werden. Wenn ich mich recht erinnere, berücksichtigt der Shapiro-Wilk auch Kovarianzen zwischen den Auftragsstatistiken.
[Es sollte bedacht werden, dass es viel mehr Tests für die Normalität gibt als diese.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- Wenn die p-Werte so wären, wie sie sein sollten, würde das einheitlich aussehen!Kurz gesagt, der Shapiro-Wilk-Test ist ein spezifischer Test für die Normalität, wohingegen die vom Kolmogorov-Smirnov-Test verwendete Methode allgemeiner, aber weniger leistungsfähig ist (was bedeutet, dass die Nullhypothese der Normalität weniger häufig korrekt verworfen wird). Beide Statistiken nehmen die Normalität als Null und erstellen eine Teststatistik auf der Grundlage der Stichprobe. Ihre Vorgehensweise unterscheidet sich jedoch in einer Weise, die sie mehr oder weniger empfindlich gegenüber Merkmalen normaler Verteilungen macht.
Wie genau W (die Teststatistik für Shapiro-Wilk) berechnet wird, ist ein wenig umstritten. Konzeptionell geht es jedoch darum, die Stichprobenwerte nach Größe zu ordnen und die Übereinstimmung mit den erwarteten Mitteln, Varianzen und Kovarianzen zu messen. Diese mehrfachen Vergleiche gegen die Normalität verleihen dem Test meines Wissens mehr Kraft als der Kolmogorov-Smirnov-Test, und das ist eine Möglichkeit, in der sie sich unterscheiden können.
Im Gegensatz dazu leitet sich der Kolmogorov-Smirnov-Normalitätstest aus einem allgemeinen Ansatz zur Beurteilung der Anpassungsgüte ab, indem die erwartete kumulative Verteilung mit der empirischen kumulativen Verteilung verglichen wird, vis:
Als solches ist es in der Mitte der Verteilung empfindlich und nicht an den Schwänzen. Allerdings ist der KS-Test konvergent, in dem Sinne, dass der Test, da n gegen unendlich geht, mit der Wahrscheinlichkeit zur wahren Antwort konvergiert (ich glaube, dass das Glivenko-Cantelli-Theorem hier zutrifft, aber jemand kann mich korrigieren). Dies sind zwei weitere Möglichkeiten, wie sich diese beiden Tests in ihrer Bewertung der Normalität unterscheiden können.
quelle