Betrachten Sie den folgenden Code und die folgende Ausgabe:
par(mfrow=c(3,2))
# generate random data from weibull distribution
x = rweibull(20, 8, 2)
# Quantile-Quantile Plot for different distributions
qqPlot(x, "log-normal")
qqPlot(x, "normal")
qqPlot(x, "exponential", DB = TRUE)
qqPlot(x, "cauchy")
qqPlot(x, "weibull")
qqPlot(x, "logistic")
Es scheint, dass das QQ-Diagramm für log-normal fast das gleiche ist wie das QQ-Diagramm für weibull. Wie können wir sie unterscheiden? Wenn sich die Punkte innerhalb des durch die beiden äußeren schwarzen Linien definierten Bereichs befinden, bedeutet dies, dass sie der angegebenen Verteilung folgen?
library(car)
in Ihren Code aufnehmen, damit die Benutzer leichter folgen können. Im Allgemeinen möchten Sie möglicherweise auch den Startwert festlegen (z. B.set.seed(1)
), um das Beispiel reproduzierbar zu machen, damit jeder genau die Datenpunkte erhalten kann, die Sie erhalten haben, obwohl dies hier wahrscheinlich nicht so wichtig ist.Antworten:
Hier sind einige Dinge zu sagen:
quelle
Ja.
Bei dieser Stichprobengröße können Sie dies wahrscheinlich nicht.
Nein. Es zeigt nur an, dass Sie die Verteilung der Daten nicht als von dieser Verteilung abweichend erkennen können. Es ist ein Mangel an Beweisen für einen Unterschied, kein Beweis für einen Mangel an Unterschieden.
Sie können fast sicher sein, dass die Daten aus einer Distribution stammen, die nicht von denen stammt, die Sie in Betracht gezogen haben (warum sollten sie genau aus einer dieser Distributionen stammen ?).
quelle