Interpretation der .L & .Q-Ausgabe eines negativen Binomial-GLM mit kategorialen Daten

14

Ich habe gerade ein negatives Binomial-GLM ausgeführt und dies ist die Ausgabe:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Meine Prädiktoren sind alle kategorisch. Bekomme ich deshalb .Lund .Q. Ich nehme an, dass sie die verschiedenen Kategorien darstellen, aber kennt jemand einen Code, mit dem ich sie kennzeichnen könnte, bevor der GLM ausgeführt wird, damit sie stattdessen als die verschiedenen Kategorien angezeigt werden?

Vivienne
quelle
Ich finde diesen Code ziemlich verwirrend. Gibt es einen einfacheren Code? Die Kategorien sind sehr einfach: Methode 1 und Methode 2, Stelle 1, Stelle 2 und Stelle 3 und Tiefe ist 5, 10 und 15
Vivienne
ats.ucla.edu/stat/r/library/contrast_coding.htm#SIMPLE - oder ats.ucla.edu/stat/r/library/contrast_coding.htm#dummy , dies ist die Standardeinstellung für nicht geordnete Faktoren in glm.
Scortchi - Monica wieder einsetzen

Antworten:

12

Ihre Variablen werden nicht nur als Faktoren codiert (um sie kategorisch zu machen), sondern auch als geordnete Faktoren. Dann passt R standardmäßig eine Reihe von Polynomfunktionen an die Ebenen der Variablen an. Die erste ist linear ( .L), die zweite ist quadratisch ( .Q), die dritte (wenn Sie genügend Ebenen hätten) wäre kubisch usw. R passt eine Polynomfunktion weniger als die Anzahl der Ebenen in Ihrer Variablen. Wenn Sie beispielsweise nur zwei Ebenen haben, wird nur der lineare Trend angepasst. Darüber hinaus sind die verwendeten Polynombasen orthogonal. (Für das, was es wert ist, ist nichts davon spezifisch für R - oder für negative Binomialmodelle - alle Software und Arten von Regressionsmodellen würden dasselbe tun.)


Wenn Sie sich speziell auf R konzentrieren und möchten, dass Ihre Variablen als geordnet oder ungeordnet codiert werden, verwenden Sie ? Factor :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor
gung - Monica wieder einsetzen
quelle
Oh, ich hatte sie jetzt bestellt, es hat die Etiketten auf, vielen Dank Gung!
Vivienne