Wie kann ich die Haupteffekte (Koeffizienten für Dummy-codierten Faktor) in einer Poisson-Regression interpretieren?
Nehmen wir das folgende Beispiel an:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
Die Ausgabe ist:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Ich weiß, dass die Vorfallrate für numberofdrugs
ist exp(-0.023)=0.977
. Aber wie interpretiere ich die Haupteffekte für die Dummy-Variablen?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
gung - Wiedereinsetzung von Monica
quelle
quelle
Antworten:
Der potenziert
numberofdrugs
Koeffizient ist der multiplikative Term zu verwenden , um die geschätzte zu berechnen ,healthvalue
wennnumberofdrugs
erhöht sich um 1 Einheit. Bei kategorialen (Faktor-) Variablen ist der potenzierte Koeffizient der multiplikative Term relativ zum Basisniveau (erster Faktor) für diese Variable (da R standardmäßig Behandlungskontraste verwendet). Dasexp(Intercept)
ist das Basisrate und alle anderen Schätzungen würde es relativ sein.In Ihrem Beispiel wird dies
healthvalue
für jemanden mit2
Drogen geschätzt"placebo"
undimprovement=="none"
wäre (unter Verwendung der Addition inside exp als Äquivalent zur Multiplikation):Während jemand auf
4
Drogen,"treated"
und"some"
Verbesserung hätte eine Schätzunghealthvalue
vonADDENDUM: Dies ist, was es bedeutet, "additiv auf der Log-Skala" zu sein. "Additiv auf der Log-Odds-Skala" war der Ausdruck, den meine Lehrerin Barbara McKnight verwendete, um die Notwendigkeit hervorzuheben, alle Termkoeffizienten zu verwenden, die in der logistischen Regression bei jeder Art von Vorhersage angewendet wurden. Sie addieren zuerst alle Koeffizienten mal kovariate Werte und potenzieren dann. Die Methode zur Rückgabe von Koeffizienten aus Regressionsobjekten in R besteht im Allgemeinen in der Verwendung der
coef()
Extraktionsfunktion (mit einer anderen Zufallsrealisierung):So ist die Berechnung der Schätzung für ein Subjekt mit
4
Drogen,"treated"
mit"some"
Verbesserung wäre:Und der lineare Prädiktor für diesen Fall sollte die Summe von sein:
Diese Grundsätze sollten für alle Statistikpakete gelten, die dem Benutzer eine Koeffiziententabelle zurückgeben. Die Methode und die Prinzipien sind allgemeiner, als es aus meiner Verwendung von R hervorgeht.
Ich kopiere ausgewählte Klärungskommentare, da sie in der Standardanzeige "verschwinden":
A: Die Koeffizienten sind die natürlichen Logarithmen der Verhältnisse. - DWin
A2: Nein. Wenn es sich um eine logistische Regression handelt, handelt es sich jedoch um eine Poisson-Regression, bei der die LHS die Anzahl der Ereignisse und der implizite Nenner die Anzahl der gefährdeten Ereignisse ist. Die potenzierten Koeffizienten sind "Ratenverhältnisse" oder "relative Risiken".
quelle