Ich habe mir die Modellierung gemischter Effekte mit dem lme4-Paket in R angesehen. Ich verwende hauptsächlich den lmer
Befehl, also stelle ich meine Frage durch Code, der diese Syntax verwendet. Ich nehme an, eine allgemeine einfache Frage könnte sein, ob es in Ordnung ist, zwei Modelle zu vergleichen, die unter lmer
Verwendung von Wahrscheinlichkeitsverhältnissen auf der Grundlage identischer Datensätze konstruiert wurden . Ich glaube, die Antwort darauf muss "nein" sein, aber ich könnte falsch sein. Ich habe widersprüchliche Informationen darüber gelesen, ob die zufälligen Effekte gleich sein müssen oder nicht, und welche Komponente der zufälligen Effekte ist damit gemeint? Also werde ich ein paar Beispiele vorstellen. Ich werde sie aus wiederholten Messdaten unter Verwendung von Wortstimuli entnehmen, vielleicht wäre so etwas wie Baayen (2008) beim Interpretieren nützlich.
Angenommen, ich habe ein Modell, in dem es zwei Prädiktoren für feste Effekte gibt. Wir nennen sie A und B und einige zufällige Effekte ... Wörter und Subjekte, die sie wahrgenommen haben. Ich könnte ein Modell wie das folgende konstruieren.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(Beachten Sie, dass ich absichtlich weggelassen habe data =
und wir gehen davon aus, dass ich es aus REML = FALSE
Gründen der Klarheit immer meine )
Welche der folgenden Modelle lassen sich mit dem Wahrscheinlichkeitsverhältnis der obigen Modelle vergleichen und welche nicht?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Ich erkenne an, dass die Interpretation einiger dieser Unterschiede schwierig oder unmöglich sein kann. Aber lassen Sie uns das für eine Sekunde beiseite legen. Ich möchte nur wissen, ob an den Änderungen etwas Grundlegendes liegt, das die Möglichkeit eines Vergleichs ausschließt. Ich möchte auch wissen, ob LRs in Ordnung sind und AIC-Vergleiche ebenfalls.
Antworten:
Mit maximaler Wahrscheinlichkeit kann jeder dieser Faktoren mit dem AIC verglichen werden. Wenn die fixen Effekte die gleichen (
m1
bism4
) sind, ist die Verwendung von REML oder ML in Ordnung, wobei REML normalerweise bevorzugt wird. Wenn sie jedoch unterschiedlich sind, kann nur ML verwendet werden. Die Interpretation ist jedoch in der Regel schwierig, wenn sich sowohl feste Effekte als auch zufällige Effekte ändern. In der Praxis empfehlen die meisten, jeweils nur den einen oder den anderen Effekt zu ändern.Die Verwendung des Likelihood-Ratio-Tests ist möglich, aber unübersichtlich, da die übliche Chi-Quadrat-Näherung nicht gilt, wenn geprüft wird, ob eine Varianzkomponente Null ist. Siehe Anikos Antwort für Details. (Ein großes Lob an Aniko, dass sie die Frage sorgfältiger als ich gelesen und meine ursprüngliche Antwort sorgfältig genug gelesen haben, um zu bemerken, dass sie diesen Punkt verfehlt hat. Danke!)
Pinhiero / Bates ist die klassische Referenz; es beschreibt das
nlme
Paket, aber die Theorie ist die gleiche. Gut meistens das selbe; Doug Bates hat seine Schlußfolgerungsempfehlungen geändert, seit er dieses Buch geschrieben hat, und die neuen Empfehlungen spiegeln sich imlme4
Paket wider . Aber das ist mehr, als ich hier beschreiben möchte. Eine besser lesbare Referenz ist Weiss (2005), Modelling Longitudinal Data.quelle
m
m
m4
m
m2
Wie @Aaron feststellte, raten viele Experten jedoch davon ab, einen solchen Likelihood-Ratio-Test durchzuführen. Mögliche Alternativen sind die Informationskriterien (AIC, BIC usw.) oder das Bootstrapping des LRT.
[1] Self, SG & Liang, K. Asymptotische Eigenschaften von Maximum-Likelihood-Schätzern und Likelihood-Ratio-Tests unter nicht standardisierten Bedingungen J. Amer. Statist. Assoc., 1987, 82, 605 & ndash; 610.
quelle