Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Ich möchte wissen, wie jede Parameterschätzung in der obigen Tabelle zu interpretieren ist.
Antworten:
Ich glaube nicht, dass der Titel Ihrer Frage genau das wiedergibt, wonach Sie fragen.
Die Frage, wie die Parameter in einem GLM zu interpretieren sind, ist sehr weit gefasst, da das GLM eine sehr breite Klasse von Modellen darstellt. Denken Sie daran, dass ein GLM eine Antwortvariable modelliert , von der angenommen wird, dass sie einer bekannten Verteilung aus der Exponentialfamilie folgt, und dass wir eine invertierbare Funktion g so gewählt haben, dass E [ yy G
für J Prädiktorvariablen x . In diesem Modell ist die Interpretation eines bestimmten Parameters β j ist die Änderungsrate von g ( y ) in Bezug auf x j . Definiere μ ≡ E [ y
Was nur bedeutet, dass die Auswirkung einer Einheitszunahme von x j auf η ist .βj η xj
Sie können die Beziehung auch folgendermaßen angeben : und E[y
Ohne etwas über wissen , ist das so weit wie möglich. β j ist die Wirkung auf η , der den transformierten bedingten Mittelwert von y , der eine Einheitszunahme in x j , und die Wirkung auf den bedingten Mittelwert von y einer Einheit Erhöhung x jg βj η y xj y xj ist .g−1(β)
Sie scheinen jedoch speziell nach der Poisson-Regression mit der Standard-Link-Funktion von R zu fragen, die in diesem Fall der natürliche Logarithmus ist. Wenn das der Fall ist, sind Sie zu fragen , eine bestimmte Art von GLM in denen und g = ln . Dann können wir eine gewisse Zugkraft in Bezug auf eine bestimmte Interpretation bekommen.y∼Poisson(λ) g=ln
Aus dem, was ich oben gesagt habe, wissen wir, dass . Und da wir wissen, dassg(μ)=ln(μ) ist, wissen wir auch, dassg-1(η)=eη ist. Wir wissen zufällig auch, dassdeη∂μ∂xj=dg−1dηβj g(μ)=ln(μ) g−1(η)=eη , also können wir sagen, dass
∂μdeηdη=eη
was endlich etwas greifbares bedeutet:
There are three important pieces to note here:
So in your example, the effect of increasing pH by 1 is to increaselny^ by y^(e0.09−1) ; that is, to multiply y^ by e0.09≈1.09 . It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.
quelle
My suggestion would be to create a small grid consisting of combinations of the two rivers and two or three values of each of the covariates, then use the
predict
function with your grid asnewdata
. Then graph the results. It is much clearer to look at the values that the model actually predicts. You may or may not want to back-transform the predictions to the original scale of measurement (type = "response"
).quelle