Überdispersion und Unterdispersion bei negativer Binomial / Poisson-Regression

11

Ich führte eine Poisson-Regression in SAS durch und stellte fest, dass der Pearson-Chi-Quadrat-Wert geteilt durch die Freiheitsgrade etwa 5 betrug, was auf eine signifikante Überdispersion hinweist. Also habe ich ein negatives Binomialmodell mit proc genmod angepasst und festgestellt, dass der Pearson-Chi-Quadrat-Wert geteilt durch die Freiheitsgrade 0,80 beträgt. Wird dies nun als unterdispers angesehen? Wenn ja, wie geht man damit um? Ich habe viel über Überdispersion gelesen und glaube, ich weiß, wie ich damit umgehen soll, aber Informationen darüber, wie ich damit umgehen oder feststellen soll, ob es eine Unterdispersion gibt, sind spärlich. Kann jemand helfen?

Vielen Dank.

StatsStudent
quelle

Antworten:

17

μμ

V(μ)=μ

V(μ)=ψμ
ψ>0p

V(μ)=aμ2+bμ+c,
λ>0
V(μ)=μ(1+μλ).
λ

λ=λ< untersuchen eine Klasse von Tests für allgemeine Varianzfunktionen.

Ich würde jedoch empfehlen, zunächst Residuendiagramme zu untersuchen, z. B. ein Diagramm der Pearson- oder Abweichungsreste (oder ihres quadratischen Werts) gegen die angepassten Werte. Wenn die funktionale Form der Varianz falsch ist, sehen Sie dies als Trichterform (oder als Trend für die quadratischen Residuen) im Residuendiagramm. Wenn die funktionale Form korrekt ist, dh kein Trichter oder Trend, kann es immer noch zu einer Über- oder Unterdispersion kommen. Dies kann jedoch durch Schätzen des Dispersionsparameters berücksichtigt werden. Der Vorteil des Residuendiagramms besteht darin, dass es deutlicher als ein Test darauf hinweist, was mit der Varianzfunktion nicht stimmt, wenn überhaupt.

Im konkreten Fall des OP kann nicht gesagt werden, ob 0,8 eine Unterdispersion der angegebenen Informationen anzeigt. Anstatt mich auf die Schätzungen 5 und 0,8 zu konzentrieren, schlage ich vor, zunächst die Anpassung der Varianzfunktionen des Poisson-Modells und des negativen Binomialmodells zu untersuchen. Sobald die am besten geeignete funktionale Form der Varianzfunktion bestimmt ist, kann bei Bedarf ein Dispersionsparameter in jedes Modell aufgenommen werden, um die statistische Inferenz für jede zusätzliche Über- oder Unterdispersion anzupassen. Wie das in SAS einfach geht, kann ich leider nicht ändern.

NRH
quelle
2
+1, das sind gute allgemeine Informationen. Es könnte für das OP hilfreicher sein, wenn Sie speziell auf die expliziten Fragen des OP eingegangen sind: (1) ist .8 unterdispers; & (2) wenn ja, wie man damit umgeht.
Gung - Reinstate Monica
@gung, ich habe die Antwort bearbeitet, um spezifischere Ratschläge zu geben. Sie können anhand der verfügbaren Informationen nicht feststellen, ob 0,8 signifikant kleiner als 1 ist, und IMHO, das sich darauf konzentriert, ob der Dispersionsparameter 1 ist, ist eine Umleitung. Meine Bearbeitung erklärt, worauf sich das OP meiner Meinung nach konzentrieren sollte.
NRH