Ich habe das folgende Modell , m_plot
ausgestattet mit lme4::lmer
mit gekreuzten zufälligen Effekten für die Teilnehmer ( lfdn
) und Artikel ( content
):
Random effects:
Groups Name Variance Std.Dev. Corr
lfdn (Intercept) 172.173 13.121
role1 62.351 7.896 0.03
inference1 24.640 4.964 0.08 -0.30
inference2 52.366 7.236 -0.05 0.17 -0.83
inference3 21.295 4.615 -0.03 0.22 0.86 -0.77
content (Intercept) 23.872 4.886
role1 2.497 1.580 -1.00
inference1 18.929 4.351 0.52 -0.52
inference2 14.716 3.836 -0.16 0.16 -0.08
inference3 17.782 4.217 -0.17 0.17 0.25 -0.79
role1:inference1 9.041 3.007 0.10 -0.10 -0.10 -0.21 0.16
role1:inference2 5.968 2.443 -0.60 0.60 -0.11 0.78 -0.48 -0.50
role1:inference3 4.420 2.102 0.30 -0.30 0.05 -0.97 0.71 0.37 -0.90
Residual 553.987 23.537
Number of obs: 3480, groups: lfdn, 435 content, 20
Ich möchte die Intraclass Correlation Coefficients (ICC) für Teilnehmer und Elemente kennen. Dank dieser großartigen Antwort weiß ich im Prinzip, wie ich den ICC für mein Modell bekomme. Ich bin mir jedoch nicht sicher, ob ich die zufälligen Steigungen einbeziehen soll oder nicht:
vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)
# with random slopes
sapply(vars, sum)/total_var
## lfdn content
## 0.33822396 0.09880349
# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
## lfdn.(Intercept) content.(Intercept)
## 0.17496587 0.02425948
Was ist das geeignete Maß für die Korrelation zwischen zwei Antworten desselben Teilnehmers auf denselben Punkt?
Antworten:
Grundsätzlich gibt es keine einzelne Zahl oder Schätzung, die den Grad der Clusterbildung in einem Modell mit zufälligen Steigungen zusammenfassen kann.
Die Intra-Class-Korrelation (ICC) kann nur als einfacher Anteil von Varianzen in Nur-Zufalls-Intercept-Modellen geschrieben werden. Um zu sehen , warum kann eine Skizze der Ableitung des ICC Ausdruck gefunden werden hier .
Wenn Sie zufällige Steigungen in die Modellgleichung einfügen, führt das Befolgen derselben Schritte stattdessen zum ICC-Ausdruck auf Seite 5 dieses Dokuments . Wie Sie sehen können, ist dieser komplizierte Ausdruck eine Funktion des Prädiktors X. Um intuitiver zu sehen, warum var (Y) bei zufälligen Steigungen von X abhängt, lesen Sie Seite 30 dieser Folien ("Warum hängt die Varianz von x ab?" ? ") .
Da der ICC eine Funktion der Prädiktoren (der x-Werte) ist, kann er nur für bestimmte Sätze von x-Werten berechnet werden. Sie könnten vielleicht versuchen, den ICC im gemeinsamen Durchschnitt der x-Werte anzugeben, aber diese Schätzung ist für die Mehrzahl der Beobachtungen nachweislich ungenau.
Alles, was ich gesagt habe, bezieht sich immer noch nur auf Fälle, in denen es einen einzigen Zufallsfaktor gibt. Mit mehreren Zufallsfaktoren wird es noch komplizierter. In einem Projekt mit mehreren Standorten, in dem die Teilnehmer an jedem Standort auf eine Stichprobe von Stimuli reagieren (dh 3 zufällige Faktoren: Standort, Teilnehmer, Stimulus), könnten wir beispielsweise nach vielen verschiedenen ICCs fragen: Welche Korrelation besteht zwischen zwei Antworten? am gleichen Ort, zum gleichen Reiz, von verschiedenen Teilnehmern? Wie wäre es an verschiedenen Orten, mit demselben Reiz und mit verschiedenen Teilnehmern? Und so weiter. @rvl erwähnt diese Komplikationen in der Antwort, mit der das OP verknüpft ist.
Wie Sie sehen können, ist der einzige Fall, in dem wir den Grad der Clusterbildung mit einem einzelnen Wert zusammenfassen können, der Fall nur mit einem zufälligen Zufallsfaktor. Da dies ein so geringer Anteil der Fälle in der Praxis ist, sind ICCs die meiste Zeit nicht so nützlich. Meine allgemeine Empfehlung ist es also, sich nicht einmal um sie zu sorgen. Stattdessen empfehle ich, nur die Varianzkomponenten zu melden (vorzugsweise in Standardabweichungsform).
quelle