Ich habe diese Daten:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
Ich habe eine Poisson-Regression durchgeführt
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
Und eine negative binomiale Regression:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
Dann berechnete ich für die Dispersionsstatistik für die Poisson-Regression:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
Und die negative binomiale Regression:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
Kann jemand ohne Verwendung von Gleichungen erklären, warum die Dispersionsstatistik für die negative binomiale Regression erheblich kleiner ist als die Dispersionsstatistik für die Poisson-Regression?
Für das Poisson - Modell, wenn die expection für die - te Beobachtung wird seine Varianz , & der Pearson Rest deshalbY i μ i μ ii Yi μi μi
Dabei ist die Schätzung des Mittelwerts. Die Parametrisierung des in MASS verwendeten negativen Binomialmodells wird hier erläutert . Wenn die expection für die - te Beobachtung ist seine Varianz , & Pearson der Rest deshalb iYiμiμi+μ2μ^ i Yi μi μi+μ2θ
Dabei ist die Schätzung des Mittelwerts. Je kleiner der Wert von - dh je mehr Extra-Poisson-Varianz -, desto kleiner ist der Rest im Vergleich zu seinem Poisson-Äquivalent. [Aber wie @whuber hervorgehoben hat, sind die Schätzungen der Mittelwerte nicht dieselben, , weil das Schätzverfahren Beobachtungen gemäß ihrer angenommenen Varianz gewichtet. Wenn Sie Wiederholungsmessungen für das te Prädiktormuster durchführen würden, würden sie näher kommen, und im Allgemeinen sollte das Hinzufügen eines Parameters eine bessere Übereinstimmung für alle Beobachtungen ergeben, obwohl ich nicht weiß, wie ich dies genau demonstrieren kann. Trotzdem sind die von Ihnen geschätzten Bevölkerungsmengen größer, wenn das Poisson-Modell gilt. Es sollte also keine Überraschung sein.] & thgr; μ & ne; ~ μ iμ~ θ μ^≠μ~ i
quelle