Wie interpretiere ich die Varianz des Zufallseffekts in einem verallgemeinerten linearen gemischten Modell?

9

In einem logistischen verallgemeinerten linearen gemischten Modell (Familie = Binomial) weiß ich nicht, wie die Varianz der zufälligen Effekte zu interpretieren ist:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Wie interpretiere ich dieses numerische Ergebnis?

Ich habe eine Stichprobe von Patienten mit Nierentransplantation in einer multizentrischen Studie. Ich habe getestet, ob die Wahrscheinlichkeit, dass ein Patient mit einer bestimmten blutdrucksenkenden Behandlung behandelt wird, in den Zentren gleich ist. Der Anteil der behandelten Patienten variiert stark zwischen den Zentren, kann jedoch auf Unterschiede in den Grundmerkmalen der Patienten zurückzuführen sein. Also schätzte ich ein verallgemeinertes lineares gemischtes Modell (logistisch), das die Hauptmerkmale der Patienten berücksichtigte. Dies sind die Ergebnisse:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Die quantitativen Variablen sind zentriert. Ich weiß, dass die Standardabweichung des Abschnitts im Krankenhaus 0,6554 in der Log-Odds-Skala beträgt. Da der Achsenabschnitt in der Log-Odds-Skala -1,804469 beträgt, beträgt die Wahrscheinlichkeit, mit dem blutdrucksenkenden Mittel eines Mannes mittleren Alters mit einem Durchschnittswert in allen Variablen und der Immunbehandlung A für ein "durchschnittliches" Zentrum behandelt zu werden, 14,1% . Und jetzt beginnt die Interpretation: Unter der Annahme, dass die zufälligen Effekte einer Normalverteilung folgen, würden wir erwarten, dass ungefähr 95% der Zentren einen Wert innerhalb von 2 Standardabweichungen vom Mittelwert von Null haben, also die Wahrscheinlichkeit, für den durchschnittlichen Mann behandelt zu werden variiert zwischen den Zentren mit einem Abdeckungsintervall von:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Ist das richtig?

Wie kann ich in glmer testen, ob die Variabilität zwischen den Zentren statistisch signifikant ist? Ich habe mit MIXNO gearbeitet, einer exzellenten Software von Donald Hedeker, und dort habe ich einen Standardfehler der geschätzten Varianz, den ich in glmer nicht habe. Wie kann ich die Wahrscheinlichkeit haben, für den "durchschnittlichen" Mann in jedem Zentrum mit einem vertraulichen Intervall behandelt zu werden?

Vielen Dank

user2310909
quelle

Antworten:

10

0,65542=0,4295

(Wenn Sie Ihre Frage klären / mehr Details zu Ihrem Modell hinzufügen, kann ich versuchen, mehr zu sagen.)

Update : Ihre Interpretation der Variation scheint korrekt zu sein. Etwas präziser,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

sollte Ihnen das 95% -Intervall (nicht wirklich Konfidenzintervalle, aber sehr ähnlich) für die Wahrscheinlichkeiten einer Baseline-Person (männlich / Durchschnittsalter / etc.) geben, die krankenhausübergreifend behandelt wird.

Zum Testen der Signifikanz des Zufallseffekts haben Sie verschiedene Möglichkeiten ( weitere Informationen finden Sie unter http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html ). (Beachten Sie, dass der Standardfehler einer RE-Varianz normalerweise kein zuverlässiger Weg ist, um die Signifikanz zu testen, da die Stichprobenverteilung häufig verzerrt / nicht normal ist.) Der einfachste Ansatz besteht darin, einen Likelihood-Ratio-Test durchzuführen, z

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

Die endgültige Division durch 2 korrigiert die Tatsache, dass der Likelihood-Ratio-Test konservativ ist, wenn der Nullwert (dh RE-Varianz = 0) an der Grenze des realisierbaren Raums liegt (dh die RE-Varianz kann nicht <0 sein).

Ben Bolker
quelle
Ich habe die Frage bearbeitet
user2310909
1
Vielen Dank, es ist mir eine Freude, jemandem vorzulesen, der sich mit dem Thema gut auskennt.
user2310909