Ich habe eine Frage zur Interpretation der Koeffizienten einer Wechselwirkung zwischen kontinuierlicher und kategorialer Variable. Hier ist mein Modell:
model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)),
data=base_708)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.4836 2.0698 10.380 < 2e-16 ***
lg_hag 8.5691 3.7688 2.274 0.02334 *
raceblack -8.4715 1.7482 -4.846 1.61e-06 ***
racemexican -3.0483 1.7073 -1.785 0.07469 .
racemulti/other -4.6002 2.3098 -1.992 0.04687 *
pdg 2.8038 0.4268 6.570 1.10e-10 ***
sexfemale 4.5691 1.1203 4.078 5.15e-05 ***
as.factor(educa)2 13.8266 2.6362 5.245 2.17e-07 ***
as.factor(educa)3 21.7913 2.4424 8.922 < 2e-16 ***
as.factor(educa)4 19.0179 2.5219 7.541 1.74e-13 ***
as.factor(educa)5 23.7470 2.7406 8.665 < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224 6.5904 -3.220 0.00135 **
lg_hag:as.factor(educa)3 -19.8083 6.1255 -3.234 0.00129 **
lg_hag:as.factor(educa)4 -8.5502 6.6018 -1.295 0.19577
lg_hag:as.factor(educa)5 -17.2230 6.3711 -2.703 0.00706 ***
Nehmen wir an, die Gleichung des Modells lautet:
E [cog] = a + b1 (lg_hag) + b2 (Educa2 * lg_hag) + b3 (Educa3 * lg_hag) + b4 (Educa4 * lg_hag) + b5 (pdg, zentriert) + andere Kovaren, wobei
b1 = difference in cog with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg
Meine Frage ist: Wenn meine Interpretation richtig ist, wie man Konfidenzintervalle für jede Effektschätzung von Wechselwirkungen (z. B. b1 + b2) aus den Konfidenzintervallen von b1 und b2 konstruiert.
categorical-data
generalized-linear-model
interaction
interpretation
Du bist sicher
quelle
quelle
Antworten:
Ihre Interpretation der Koeffizienten des Modells ist nicht vollständig korrekt. Lassen Sie mich zunächst die Bedingungen des Modells zusammenfassen.
Kategoriale Variablen (Faktoren): , s e x und e d u c arace sex educa
Der Faktorrace={white,black,mexican,multi/other}
race
vier Stufen hat: .Der Faktorsex={male,female}
sex
hat zwei Ebenen: .Der Faktore du c a = { 1 , 2 , 3 , 4 , 5 }
educa
hat fünf Ebenen: .Standardmäßig verwendet R Behandlungskontraste für kategoriale Variablen. In diesen Kontrasten wird der erste Wert des Faktors als Referenzpegel verwendet und die verbleibenden Werte werden gegen die Referenz getestet. Die maximale Anzahl von Kontrasten für eine kategoriale Variable entspricht der Anzahl von Ebenen minus eins.
Die Kontraster a c e = b l a c k v s . r a c e = w h i t e r a c e = m e x i c a n v s . r a c e = w h i t e .r a c e = m u l t i / o t h e r v s . r a c e = w h i t e
race
ermöglichen das Testen der folgenden Unterschiede: , r a c e = m e x i c a n v s . r a c e = w h i t e und r a c eFür den Faktor ist der Referenzpegel 1 , das Kontrastmuster ist analog. Diese Effekte können als Differenz in der abhängigen Variablen interpretiert werden. In Ihrem Beispiel der Mittelwert ist 13,8266 Einheiten höher für e d u c a = 2 im Vergleich zu e d u c a = 1 ( ).e du c a 1 13.8266 e du c a = 2 e du c a = 1
cog
as.factor(educa)2
Ein wichtiger Hinweis: Wenn in einem Modell Behandlungskontraste für eine kategoriale Variable vorhanden sind, basiert die Schätzung weiterer Effekte auf dem Referenzniveau der kategorialen Variablen, wenn auch Wechselwirkungen zwischen weiteren Effekten und der kategorialen Variablen berücksichtigt werden. Wenn die Variable nicht Teil einer Interaktion ist, entspricht ihr Koeffizient dem Durchschnitt der einzelnen Steigungen von Teilmengen dieser Variablen entlang aller verbleibenden kategorialen Variablen. Die Auswirkungen von und e d u c a entsprechen durchschnittlichen Effekten in Bezug auf die Faktorstufen der anderen Variablen. Um die Gesamtwirkung von r a c e zu testen , müssten Sie gehenr a c e e du c a r a c e und s e x aus dem Modell.e du c a s e x
Numerische Variablen: und p d gl g_ h a g p dG
Beide1
lg_hag
undpdg
sind numerische Variablen, daher stellen die Koeffizienten die Änderung der abhängigen Variablen dar, die mit einer Zunahme des Prädiktors um .lg_hag:as.factor(educa)2
-21.2224
quelle
race=white
undsex=male
nur.“ Bist du dir da sicher? Ich frage, weil wederrace
nochsex
in Wechselwirkung mit demlg_hag×educa
Begriff steht ... Ich betrachte mehrere Texte, die ich nicht explizit angegeben sehe.pdg
vom Referenzniveau abhängt, was eindeutig nicht der Fall ist. Wenn ich den Referenzwert eines der Faktoren ändere (z. B.sex
),pdg
ändert sich die Schätzung für NICHT ...pdg
tatsächlich nicht von der Spezifikation der Kontraste ab. Ich werde die Antwort entsprechend ändern.