Vergleich von Regressionsmodellen anhand von Zähldaten

11

Ich habe kürzlich 4 multiple Regressionsmodelle für dieselben Prädiktor- / Antwortdaten angepasst. Zwei der Modelle passen zur Poisson-Regression.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Zwei der Modelle passen zu einer negativen binomialen Regression.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Gibt es einen statistischen Test, mit dem ich diese Modelle vergleichen kann? Ich habe den AIC als Maß für die Anpassung verwendet, aber AFAIK stellt keinen tatsächlichen Test dar.

Daniel Standage
quelle
Sie möchten die Passform der Modelle mit einem statistischen Test vergleichen, oder? Welche Art von Hypothese möchten Sie testen?
Feuerfeder
@Firefeather Zum Beispiel würde ich zu Test möge , ob der Sitz von model.nb.interist deutlich besser als die model.pois.inter. Ja, der AIC ist niedriger, aber wie viel niedriger ist deutlich besser ?
Daniel Standage
Hinweis: Die Antwort auf diese Frage muss nicht unbedingt den AIC enthalten.
Daniel Standage
Ich kenne die Antwort auf diese Frage nicht, aber ich kann einen Anfang geben. Ich weiß , Sie können einen verwenden - Test zum Vergleich gegen (und in ähnlicher Weise zu vergleichen , gegen ), aber ich kann nicht , dass Vergleiche zwischen einem Poisson - Modell und einem negativen Binomialmodells funktionieren würde gewährleisten. Ich frage mich, ob ein Test zum Vergleich der Varianzen jedes Paares zuverlässig wäre. F.Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF
Feuerfeder
1
@Firefeather, ja, ich bin mir der Notwendigkeit bewusst, das familiäre Konfidenzniveau zu kontrollieren. Wäre Scheffe hier angemessener als beispielsweise Bonferroni?
Daniel Standage

Antworten:

14

Sie können das negative Binomialmodell mit dem entsprechenden Poisson-Modell mit einem Likelihood-Ratio-Test vergleichen. Ein Poisson-Modell entspricht einem negativen Binomialmodell mit einem Überdispersionsparameter von Null. Daher handelt es sich um verschachtelte Modelle, und die Wahrscheinlichkeitsverhältnisse sind gültig. Die Komplikation besteht darin, dass der Überdispersionsparameter auf nicht negativ beschränkt ist, dh logischerweise nicht kleiner als Null sein kann, sodass sich die Nullhypothese an der Grenze des Parameterraums befindet. Dies bedeutet, dass Sie die doppelte logarithmische Wahrscheinlichkeit nicht mit einer Chi-Quadrat-Verteilung mit einem Freiheitsgrad vergleichen müssen, sondern mit einer Mischungsverteilung, die aus gleichen Teilen eines Chi-Quadrats mit 1 df und einer Punktmasse bei Null besteht (eine Chi-Quadrat-Verteilung mit null Freiheitsgraden). In der Praxis bedeutet dies, dass Sie den p-Wert mit dem Chi-Quadrat mit 1 df berechnen und dann halbieren können. Weitere Einzelheiten und Hintergrundinformationen finden Sie in Fall 5 vonSelf & Liang JASA 1987; 82 : 605 & ndash; 610. .

Beachten Sie, dass einige statistische Softwarepakete wie Stata dies alles automatisch für Sie erledigen, wenn Sie ein negatives Binomialmodell anpassen. Tatsächlich habe ich einen Großteil der oben genannten Dinge schamlos aus dem Stata-Hilfesystem entfernt - wenn Sie Stata sehen help j_chibar.

ein Stop
quelle
5

Ich glaube, dass anova()R dafür verwendet werden kann. Trotz seines Namens ist es ein Likelihood-Ratio-Test. Crawley hat in seinem The R Book einige Anwendungsbeispiele.

Roman Luštrik
quelle
1

Da die Modelle verschachtelt sind, können Sie einen Likelihood-Ratio-Test durchführen.

Im Allgemeinen ist dies jedoch nicht der Fall. Wenn Sie also nicht verschachtelte Modelle vergleichen möchten, können Sie den Vuong-Test verwenden .

Xodarap
quelle