Ich habe gerade ein negatives Binomial-GLM ausgeführt und dies ist die Ausgabe:
Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat,
init.theta = 1.080668549, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2452 -0.9973 -0.3028 0.3864 1.8727
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.6954 0.1152 14.720 < 2e-16 ***
method.L -0.6828 0.1637 -4.171 3.04e-05 ***
site.L 0.9952 0.2050 4.854 1.21e-06 ***
site.Q -0.4634 0.1941 -2.387 0.017 *
depth.L 0.8951 0.1988 4.502 6.74e-06 ***
depth.Q 0.2060 0.1984 1.038 0.299
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)
Null deviance: 185.1 on 89 degrees of freedom
Residual deviance: 100.8 on 84 degrees of freedom
AIC: 518.24
Meine Prädiktoren sind alle kategorisch. Bekomme ich deshalb .L
und .Q
. Ich nehme an, dass sie die verschiedenen Kategorien darstellen, aber kennt jemand einen Code, mit dem ich sie kennzeichnen könnte, bevor der GLM ausgeführt wird, damit sie stattdessen als die verschiedenen Kategorien angezeigt werden?
glm
.Antworten:
Ihre Variablen werden nicht nur als Faktoren codiert (um sie kategorisch zu machen), sondern auch als geordnete Faktoren. Dann passt R standardmäßig eine Reihe von Polynomfunktionen an die Ebenen der Variablen an. Die erste ist linear (
.L
), die zweite ist quadratisch (.Q
), die dritte (wenn Sie genügend Ebenen hätten) wäre kubisch usw. R passt eine Polynomfunktion weniger als die Anzahl der Ebenen in Ihrer Variablen. Wenn Sie beispielsweise nur zwei Ebenen haben, wird nur der lineare Trend angepasst. Darüber hinaus sind die verwendeten Polynombasen orthogonal. (Für das, was es wert ist, ist nichts davon spezifisch für R - oder für negative Binomialmodelle - alle Software und Arten von Regressionsmodellen würden dasselbe tun.)Wenn Sie sich speziell auf R konzentrieren und möchten, dass Ihre Variablen als geordnet oder ungeordnet codiert werden, verwenden Sie ? Factor :
quelle