Ich habe eine Frage zur Parameterinterpretation für eine GLM mit einer gamma-verteilten abhängigen Variablen. Dies ist, was R für mein GLM mit einem Log-Link zurückgibt:
Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool,
family = Gamma(link = log), data = fakesoep)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.47399 -0.31490 -0.05961 0.18374 1.94176
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.2202325 0.2182771 28.497 < 2e-16 ***
height 0.0082530 0.0011930 6.918 5.58e-12 ***
age 0.0001786 0.0009345 0.191 0.848
educat 0.0119425 0.0009816 12.166 < 2e-16 ***
married -0.0178813 0.0173453 -1.031 0.303
sex -0.3179608 0.0216168 -14.709 < 2e-16 ***
language 0.0050755 0.0279452 0.182 0.856
highschool 0.3466434 0.0167621 20.680 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.1747557)
Null deviance: 757.46 on 2999 degrees of freedom
Residual deviance: 502.50 on 2992 degrees of freedom
AIC: 49184
Wie interpretiere ich die Parameter? Wenn ich exp(coef())
mein Modell berechne , erhalte ich ~ 500 für den Achsenabschnitt. Nun, ich glaube, das bedeutet nicht das erwartete Einkommen, wenn alle anderen Variablen konstant gehalten werden, oder? Seit dem Durchschnitt oder mean(age)
liegt bei ~ 2000. Ich habe außerdem keine Ahnung, wie man die Richtung und den Wert der Koeffizienten der Kovariaten interpretiert.
r
generalized-linear-model
interpretation
gamma-distribution
gung - Wiedereinsetzung von Monica
quelle
quelle
Antworten:
Die logarithmisch verknüpfte Gamma-GLM-Spezifikation ist identisch mit der exponentiellen Regression:
Die dritte Methode besteht darin, die Koeffizienten zu potenzieren. Beachten Sie, dass:
quelle
Zuerst würde ich mir die Residuen ansehen, um zu sehen, wie gut das Modell passt. Wenn es in Ordnung ist, würde ich versuchen, andere Link-Funktionen zu verwenden, es sei denn, ich hätte Grund zu der Annahme, dass es sich tatsächlich um eine Gamma-Verteilung handelt. Wenn das Gamma immer noch überzeugend aussieht, würde ich zu dem Schluss kommen, dass die statistisch signifikanten Begriffe der Achsenabschnitt, die Größe, die Bildung, das Geschlecht und die Highschool sind (diejenigen, die mit drei Sternen markiert sind). Unter sich kann man nicht mehr sagen, es sei denn, sie sind standardisiert (haben den gleichen Bereich).
Antwort auf Kommentar: Ich verstehe Ihre Frage jetzt besser. Das können Sie auf jeden Fall! Eine Erhöhung der Höhe um eine Einheit führt zu einer exp (0,0082530) -1 ~ = 0,0082530 (unter Verwendung der exp x = 1 + x-Approximation für kleines x) relativen Änderung des Einkommens. Sehr einfach zu interpretieren, nein?
quelle