R in Action (Kabacoff, 2011) schlägt die folgende Routine vor, um die Überdispersion in einer logistischen Regression zu testen:
Passen Sie die logistische Regression mithilfe der Binomialverteilung an:
model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
family=binomial(), data=iris)
Anpassung der logistischen Regression mithilfe der Quasibinomverteilung:
model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width,
family=quasibinomial(), data=iris)
Verwenden Sie Chi-Quadrat, um auf Überdispersion zu testen:
pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual,
model_binom$df.residual, lower = F)
# [1] 0.7949171
Könnte jemand erklären, wie und warum die Chi-Quadrat-Verteilung hier verwendet wird, um auf Überdispersion zu testen? Der p-Wert beträgt 0,79 - wie zeigt dies, dass Überdispersion im Binomialverteilungsmodell kein Problem darstellt?
r
regression
distributions
logistic
overdispersion
luciano
quelle
quelle
Antworten:
Der beschriebene Ansatz erfordert unnötige Berechnungen. Die Teststatistik ist gerecht
quelle
sum(residuals(model_binom, type = "deviance")^2)/model_binom$df.residual