Dispersion in summary.glm ()

13

Ich habe ein Glm.nb von durchgeführt

glm1<-glm.nb(x~factor(group))

wobei group eine kategoriale und x eine metrische Variable ist. Wenn ich versuche, eine Zusammenfassung der Ergebnisse zu erhalten, werden geringfügig unterschiedliche Ergebnisse angezeigt, je nachdem, ob ich summary()oder verwende summary.glm. summary(glm1)gibt mir

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

Während summary.glm (glm1) gibt mir

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Ich verstehe die Bedeutung des Dispersionsparameters, aber nicht der Linie

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

Im Handbuch heißt es, dass es sich um die geschätzte Streuung handeln würde, aber es scheint eine schlechte Schätzung zu sein, da 0,95 nicht nahe bei 0,7109 liegt, oder ist die geschätzte Streuung etwas anderes als der geschätzte Streuungsparameter? Ich denke, ich muss die Dispersion in summary.nb(x, dispersion=)etwas einstellen , aber ich bin mir nicht sicher, ob ich die Dispersion auf 1 einstellen muss (was das gleiche Ergebnis ergibt, als summary()ob ich eine Schätzung des Dispersionsparameters einfügen sollte, In diesem Fall führt zu summary.nb(glm1, dispersion=0.7109)oder etwas anderes? Oder bin ich in Ordnung, wenn ich nur das benutze summary(glm1)?

Renoir Pulitz
quelle
2
Verwenden Sie summary (), wenn es an die entsprechende S3-Methode für class negbin gesendet wird. Die Dispersion muss natürlich 1 sein, was geschätzt wird, ist Theta, was besser als Formparameter bezeichnet wird, um Verwechslungen zu vermeiden. Siehe auch stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
Momo

Antworten:

13

summary.glm"negbin"summary.glmdispersionsummary.glm glmϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmAuf dem Modell mit glm.nbdem In-Code

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial"ϕsummary.negbin

ϕdispersion

Zweitens missverstehen Sie die Ausgabe. Wenn du siehst

Negative Binomial(0.7109)

θ^ϕ

ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

negbinϕ

Setzen Sie Monica - G. Simpson wieder ein
quelle
5
+1 Schöne Erklärung. Ich habe zwei kleine Anmerkungen: Der Dispersionsparameter in Binomial, Poisson und Negativ-Binomial mit bekanntem Formparameter ist 1 gemäß Definition der Exponentialfamilie (dies ist keine Annahme). Wenn Sie sagen, dass eine andere Streuung geschätzt und der Summierungsmethode zugeführt werden kann, muss man vorsichtig sein, da man sich in ein Quasi-Territorium wagen würde, das sich insbesondere auf die Wahrscheinlichkeit auswirkt.
Momo
@Momo Gut gesagt. Ich war hin- und hergerissen zwischen dem, was Sie angeben, und den Details der Hilfeseite für die jeweiligen Funktionen.
Setzen Sie Monica - G. Simpson
2

θ1θ11θEY.EμEμ

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

Erwartung

EY.=μ

& Varianz

VarY.=μ+μ2θ

Wie @Momo hervorhebt, ist der Dispersionsparameter eine andere Sache, die Sie variieren lassen würden, um eine Quasi-Wahrscheinlichkeitsschätzung durchzuführen. Für das negative Binomialmodell und das (wahre) Poisson-Modell ist es zu Recht auf einen Wert von eins festgelegt.

Scortchi - Wiedereinsetzung von Monica
quelle