Was ist Theta in einer negativen binomischen Regression, die mit R ausgestattet ist?

26

Ich habe eine Frage zu einer negativen binomischen Regression: Angenommen, Sie haben die folgenden Befehle:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Beachten Sie, dass cars ein Datensatz ist, der in R verfügbar ist, und es ist mir egal, ob dieses Modell sinnvoll ist.)

Was ich wissen möchte, ist: Wie kann ich die Variable interpretieren theta(wie am Ende eines Aufrufs von zurückgegeben summary). Ist dies der Formparameter der Negbin-Verteilung und kann er als Maß für die Schräglage interpretiert werden?

MarkDollar
quelle
Eine Zusammenfassung dessen, was MASS sagt, finden Sie hier .
Scortchi

Antworten:

17

Ja, thetaist der Formparameter der negativen Binomialverteilung, und nein, Sie können ihn nicht wirklich als Maß für die Schiefe interpretieren. Etwas präziser:

  • Die Schiefe hängt vom Wert theta, aber auch vom Mittelwert ab
  • Es gibt keinen Wert, der thetaIhnen einen Mangel an Schräglauf garantiert

Wenn ich es nicht vermasselt habe , ist die Schiefe in der mu/ theta-Parametrisierung, die bei der negativen binomischen Regression verwendet wird

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

In diesem Zusammenhang wird üblicherweise als Maß für die Überdispersion in Bezug auf die Poisson-Verteilung interpretiert. Die Varianz des negativen Binomials ist μ + μ 2 / θ , so dass θ die übermäßige Variabilität im Vergleich zu Poisson (was μ sein würde ) und nicht den Versatz wirklich steuert .θμ+μ2/θθμ

Aniko
quelle
danke soweit! Das ist eine gute Hilfe ... Aber: Wie kann ich hohe oder (niedrige) Theta-Werte interpretieren? In McCaullaughs Buch verallgemeinerte lineare Modelle gibt es einen Link zu dieser Arbeit von anscombe, um eine Interpretation von k zu machen. Aber leider verstehe ich es nicht wirklich. Das Papier ist claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar
Sie müssen nur die erste Seite lesen. Theta (oder k in anscombe) ist also der Formparameter der Negbin-Verteilung und es gelingt, wenn die Verteilung näher an Gamma (k -> 0) oder Poisson (k -> unendlich) liegt. Aber was bedeutet es für die Passform? Wie kann ich Theta zum Beispiel für die Autoschätzung interpretieren?
MarkDollar
33

Ich wurde von einem meiner Studenten in meinem Modelling Count Data- Kurs auf diese Site verwiesen . Es scheint eine Menge Fehlinformationen über das negative Binomialmodell zu geben, insbesondere in Bezug auf die Dispersionsstatistik und die Dispersionsparameter.

μglmglm.nb θ

glm.nbglmμ+μ2θμ+αμ2glm.nbglmglm.nbAnscheinend hat er die indirekte Beziehung von McCullagh & Nelder übernommen, aber Nelder (der 1972 Mitbegründer von GLM war) schrieb 1993 sein kk-System-Add-On für Genstat, in dem er argumentierte, dass die direkte Beziehung bevorzugt wird. Er und seine Frau besuchten mich und meine Familie ungefähr alle zwei Jahre in Arizona, angefangen Anfang 1993 bis zum Jahr vor seinem Tod. Wir haben dies ziemlich gründlich besprochen, da ich eine direkte Beziehung zu dem glm-Programm hergestellt hatte, das ich Ende 1992 für Stata- und Xplore-Software und 1994 für ein SAS-Makro geschrieben hatte.

nbinomialαθnbinomial

Joseph Hilbe
quelle
2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"Form" - letzteres finde ich nicht unangemessen, da es die Form bestimmt beeinflusst.
Momo
Was ist die Reichweite von Theta? Muss Theta ein Wert größer als eins sein?
News_is_Selection_Bias
2

Glm Referenz-Negativ-Binomial: enter image description here

Das Wikipedia-negative Binomial 'r' ist glms 'Theta', was impliziert, dass glm 'Theta' der Formparameter ist. In einfachen Worten ist glms 'Theta' die Anzahl der Ausfälle.

datageek
quelle