Für die Analyse der Anzahl der nicht aufgeblasenen Vögel möchte ich Modelle mit der Anzahl der nicht aufgeblasenen Vögel unter Verwendung des R-Pakets pscl anwenden . Wenn ich mir jedoch das Beispiel in der Dokumentation für eine der Hauptfunktionen ( ? Zeroinfl ) ansehe , bezweifle ich, was der wahre Vorteil dieser Modelle ist. Gemäß dem dort angegebenen Beispielcode berechnete ich Standard-Poisson-, Quasi-Poisson- und negative Bionomialmodelle, einfache Poisson- und negative Binomialmodelle mit Null-Inflation und Null-Inflations-Poisson- und Negativ-Binomial-Modelle mit Regressoren für die Nullkomponente. Dann überprüfte ich die Histogramme der beobachteten und der angepassten Daten. (Hier ist der Code zum Replizieren.)
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
Ich kann keinen grundlegenden Unterschied zwischen den verschiedenen Modellen feststellen (ansonsten erscheinen mir die Beispieldaten nicht sehr "null-aufgeblasen" ...); Tatsächlich liefert keines der Modelle eine halbwegs vernünftige Schätzung der Anzahl der Nullen. Kann jemand erklären, was der Vorteil der Modelle ohne Luftdruck ist? Ich nehme an, es muss einen Grund gegeben haben, dies als Beispiel für die Funktion zu wählen.
quelle