Die Varianz zufälliger Effekte in lmer () -Modellen verstehen

16

Ich habe Probleme, die Ausgabe meines lmer()Modells zu verstehen . Es ist ein einfaches Modell einer Ergebnisvariablen (Support) mit unterschiedlichen Zustandsabschnitten / Zustandszufallseffekten:

mlm1 <- lmer(Support ~ (1 | State))

Die Ergebnisse von summary(mlm1)sind:

Linear mixed model fit by REML 
Formula: Support ~ (1 | State) 
   AIC   BIC logLik deviance REMLdev
 12088 12107  -6041    12076   12082
Random effects:
 Groups   Name        Variance  Std.Dev.
 State    (Intercept) 0.0063695 0.079809
 Residual             1.1114756 1.054265
Number of obs: 4097, groups: State, 48

Fixed effects:
            Estimate Std. Error t value
(Intercept)  0.13218    0.02159   6.123

Ich gehe davon aus, dass die Varianz der unterschiedlichen Zustandsabschnitte / zufälligen Effekte ist 0.0063695. Aber wenn ich den Vektor dieser Zustands-Zufallseffekte extrahiere und die Varianz berechne

var(ranef(mlm1)$State)

Das Ergebnis ist:, 0.001800869erheblich kleiner als die von gemeldete Varianz summary().

Soweit ich es verstehe, kann das von mir angegebene Modell wie folgt geschrieben werden:

yi=α0+αs+ϵi, for i={1,2,...,4097}

αsN(0,σα2), for s={1,2,...,48}

Wenn dies korrekt ist, sollte die Varianz der Zufallseffekte ( ) σ 2 α sein . Diese sind jedoch in meiner Passform nicht wirklich gleichwertig .αsσα2lmer()

nomad545
quelle
Haben Sie Kenntnisse darüber, wie Parameter geschätzt werden lmer()? Es scheint , dass Sie postulieren , dass durch die empirische Varianz der geschätzten Zufallseffekte geschätzt α s . Die Beschreibung Ihres Modells ist nicht klar (perharps y i sollte y i s sein ). Ist es ein ausgewogenes Design? σα2α^syiyis
Stéphane Laurent
Hier ist eine sehr ähnliche Frage mit einer etwas anderen Antwort
Arne Jonas Warnke

Antworten:

11

Dies ist eine klassische Einweganova. Eine sehr kurze Antwort auf Ihre Frage lautet, dass die Varianzkomponente aus zwei Begriffen besteht.

σ^α2=E[148s=148αs2]=148s=148α^s2+148s=148var(α^s)

Der von Ihnen berechnete Term ist also der erste Term auf der rechten Seite (da zufällige Effekte den Mittelwert Null haben). Der zweite Term hängt davon ab, ob REML von ML verwendet wird, und von der Summe der quadratischen Standardfehler Ihrer zufälligen Effekte.

Wahrscheinlichkeitslogik
quelle
2
OK habe es! Also ist die Summe der quadrierten SEs der REs - 1/48 * sum((se.ranef(mlm1)$State)^2)- 0.004557198. Die Varianz der Punktschätzungen der REs (erhalten wie oben unter Verwendung von var(ranef(mlm1)$State)) ist 0.001800869. Die Summe ist 0.006358067, was die Varianz ist, die summary()für das lmer()obige Modell angegeben wurde, mindestens 4 oder 5 Stellen. Vielen Dank @ Wahrscheinlichkeit
nomad545
2
Wenn Sie diese Antwort und den Kommentar zur Hilfe lesen möchten, beachten Sie, dass nomad545 auch das armR-Paket für die se.ranef()Funktion verwendet hat.
ndoogan
1
@probabilityislogic: Können Sie genauer erläutern, wie diese Gleichung berechnet wurde? Wie wurde die zweite Gleichstellung erreicht? Sollte es nach der ersten Gleichheit keinen Hut auf dem Alpha geben?
user1357015
1
@ user1357015 - Eine Möglichkeit, dies zu sehen, besteht darin, den Gradienten der (Grenz-) Log-Wahrscheinlichkeit nach dem Herausintegrieren der Zufallseffekte zu betrachten. Das heißt, differenzieren Sie die WahrscheinlichkeitY.NÖrmeinl(1nα0,Σ) wo Σ=ichnσe2+σα2ZZTist die "bedingungslose" Varianz von Y. Wenn Sie dies tun (plus einige Manipulationen), erhalten Sie die obige Gleichheit. Die zweite Gleichheit folgt, weilE(αs)=0 (unter dem Modell) Bedeutung veinr(αs)=E(αs2)
Wahrscheinlichkeitsrechnung