Ich habe einen wiederholten Entwurf durchgeführt, bei dem ich 30 Männer und 30 Frauen in drei verschiedenen Aufgaben getestet habe. Ich möchte verstehen, wie unterschiedlich sich Männer und Frauen verhalten und wie das von der jeweiligen Aufgabe abhängt. Ich habe sowohl das lmer- als auch das lme4-Paket verwendet, um dies zu untersuchen. Ich habe jedoch nicht versucht, die Annahmen für beide Methoden zu überprüfen. Der Code, den ich ausführe, ist
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
Ich habe geprüft, ob die Interaktion das beste Modell ist, indem ich sie mit dem einfacheren Modell ohne die Interaktion verglichen und eine Anova ausgeführt habe:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
F1: Ist es in Ordnung, diese kategorialen Prädiktoren in einem linearen gemischten Modell zu verwenden?
F2: Verstehe ich richtig, dass es in Ordnung ist, dass die Ergebnisvariable ("Verhalten") nicht normal verteilt werden muss (über Geschlecht / Aufgaben)?
F3: Wie kann ich die Homogenität der Varianz überprüfen? Für ein einfaches lineares Modell verwende ich plot(LM$fitted.values,rstandard(LM))
. Ist die Verwendung plot(reside(lm.base1))
ausreichend?
F4: Um auf Normalität zu prüfen, ist der folgende Code in Ordnung?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
quelle
Antworten:
Q1: Ja - genau wie jedes Regressionsmodell.
F2: Genau wie bei allgemeinen linearen Modellen muss Ihre Ergebnisvariable nicht normal als univariate Variable verteilt werden. LME-Modelle setzen jedoch voraus, dass die Residuen des Modells normalverteilt sind. Eine Transformation oder das Hinzufügen von Gewichten zum Modell wäre daher eine Möglichkeit, sich darum zu kümmern (und dies natürlich anhand von Diagnoseplots zu überprüfen).
Q3:
plot(myModel.lme)
Q4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Mit diesem Code können Sie QQ-Diagramme für jede Ebene der zufälligen Effekte erstellen. LME-Modelle gehen davon aus, dass nicht nur die Residuen innerhalb des Clusters normal verteilt sind, sondern auch jede Ebene der zufälligen Effekte. Variieren Sie die Wertelevel
von 0, 1 bis 2, um Ratten-, Aufgaben- und subjektinterne Residuen zu überprüfen.EDIT: Ich sollte auch hinzufügen, dass, obwohl Normalität angenommen wird und Transformation wahrscheinlich hilft, Probleme mit nicht normalen Fehlern / zufälligen Effekten zu reduzieren, es nicht klar ist, dass alle Probleme tatsächlich gelöst sind oder dass keine Verzerrung eingeführt wird. Wenn für Ihre Daten eine Transformation erforderlich ist, sollten Sie bei der Schätzung der zufälligen Effekte vorsichtig sein. Hier ist ein Artikel, der dies anspricht .
quelle
Sie scheinen in Bezug auf die Annahmen in Bezug auf mehrstufige Modelle irreführend zu sein. Es gibt keine Annahme einer Homogenität der Varianz in den Daten, nur dass die Residuen ungefähr normalverteilt sein sollten. Und kategoriale Prädiktoren werden die ganze Zeit in der Regression verwendet (die zugrunde liegende Funktion in R, die eine ANOVA ausführt, ist der lineare Regressionsbefehl).
Einzelheiten zur Überprüfung der Annahmen finden Sie im Pinheiro and Bates-Buch (S. 174, Abschnitt 4.3.1). Wenn Sie lme4 verwenden möchten (wofür das Buch nicht geschrieben ist), können Sie die Diagramme mit plot with a
lmer
model (?plot.merMod
) replizieren .Um die Normalität schnell zu überprüfen, wäre es einfach
qqnorm(resid(myModel))
.quelle
Zu Q2:
Gemäß dem Buch von Pinheiro und Bates können Sie den folgenden Ansatz verwenden:
Wenn Sie prüfen möchten, ob die Abweichungen gleich sind, können
sex
Sie diesen Ansatz verwenden:Bei unterschiedlichen Abweichungen können Sie Ihr Modell folgendermaßen aktualisieren:
Darüber hinaus können Sie sich die
robustlmm
Verpackung ansehen , die ebenfalls einen Wiegeansatz verwendet. Kollers Dissertation zu diesem Konzept liegt als Open Access vor ("Robust Estimation of Linear Mixed Models"). Die Zusammenfassung lautet:Ich habe nicht genug Punkte für Kommentare. Ich sehe jedoch die Notwendigkeit, einen Aspekt von @Johns Antwort oben zu klären. Pinheiro und Bates geben auf p an. 174:
Diese Aussage ist in der Tat nicht eindeutig in Bezug auf homogene Varianzen und ich bin nicht tief genug in der Statistik, um alle mathematischen Grundlagen des LME-Konzepts zu kennen. Jedoch auf p. 175, §4.3.1, der Abschnitt über die Annahme 1, den sie schreiben:
Auch in den folgenden Beispielen sind " konstante Varianzen " in der Tat wichtig. Man kann also spekulieren, ob sie homogene Varianzen implizieren, wenn sie auf p " identisch normalverteilt" schreiben . 174 ohne es direkter anzusprechen.
quelle
F1: Ja, warum nicht?
F2: Ich denke, die Voraussetzung ist, dass die Fehler normal verteilt sind.
F3: Kann zum Beispiel mit dem Leven-Test getestet werden.
quelle