Fragen, wie zufällige Effekte in lmer angegeben werden

55

Kürzlich habe ich gemessen, wie die Bedeutung eines neuen Wortes bei wiederholten Expositionen (Praxis: Tag 1 bis Tag 10) durch Messen von ERPs (EEGs) ermittelt wird, wenn das Wort in verschiedenen Kontexten betrachtet wurde. Ich kontrollierte auch die Eigenschaften des Kontexts, zum Beispiel seine Nützlichkeit für die Entdeckung der neuen Wortbedeutung (hoch gegen niedrig). Mich interessiert vor allem die Wirkung der Praxis (Tage). Da einzelne ERP-Aufzeichnungen verrauscht sind, werden ERP-Komponentenwerte durch Mitteln über die Versuche einer bestimmten Bedingung erhalten. Mit der lmerFunktion habe ich folgende Formel angewendet:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

und

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Ich habe auch das Äquivalent der folgenden zufälligen Effekte in der Literatur gesehen:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Was wird durch die Verwendung eines Zufallsfaktors der Form erreicht participants:context? Gibt es eine gute Quelle, aus der jemand mit nur flüchtigen Kenntnissen der Matrixalgebra genau verstehen kann, was Zufallsfaktoren in linearen gemischten Modellen bewirken und wie sie ausgewählt werden sollten?

alwin hoff
quelle

Antworten:

77

Ich beschreibe, welches Modell jeder Ihrer Aufrufe zu lmer()passt und wie sie sich unterscheiden, und beantworte dann Ihre letzte Frage zur Auswahl zufälliger Effekte.

Jeder der drei Modelle enthalten fixe Effekte für practice, contextund die Wechselwirkung zwischen den beiden. Die zufälligen Effekte unterscheiden sich zwischen den Modellen.

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

participantsparticipant0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Dieses Modell enthält neben einem zufälligen Achsenabschnitt auch eine zufällige Steigung in practice. Dies bedeutet, dass die Geschwindigkeit, mit der Personen aus der Praxis lernen, von Person zu Person unterschiedlich ist. Wenn eine Person einen positiven Zufallseffekt hat, steigt sie mit dem Üben schneller als der Durchschnitt, während ein negativer Zufallseffekt anzeigt, dass sie mit dem Üben weniger schnell als der Durchschnitt lernt oder möglicherweise mit dem Üben schlechter wird, abhängig von der Varianz des Zufalls Wirkung (dies setzt voraus, dass die festgelegte Wirkung der Praxis positiv ist).

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Dieses Modell paßt eine zufällige Steigung und Schnitt in practice(Sie tun müssen , um (practice-1|...)den Schnittpunkt zu unterdrücken), wie nur das Vorgängermodell, aber jetzt haben Sie auch eine zufällige Steigung und Schnitt in dem Faktor hinzugefügt participants:context, was ein neuer Faktor ist , deren Pegel sind jede Kombination der in participantsund vorhandenen Ebenen contextund die entsprechenden zufälligen Effekte werden von Beobachtungen geteilt, die den gleichen Wert von beiden participantsund haben context. Um in dieses Modell zu passen, müssen Sie mehrere Beobachtungen haben, die für beide participantsund dieselben Werte habencontextoder das Modell ist nicht abschätzbar. In vielen Situationen sind die von dieser Interaktionsvariablen erstellten Gruppen sehr spärlich und führen zu sehr verrauschten / schwierig anzupassenden Zufallseffektmodellen. Sie sollten daher vorsichtig sein, wenn Sie einen Interaktionsfaktor als Gruppierungsvariable verwenden.

Grundsätzlich (lesen Sie: ohne zu kompliziert zu werden) sollten zufällige Effekte verwendet werden, wenn Sie der Meinung sind, dass die Gruppierungsvariablen "Taschen" der Inhomogenität im Datensatz definieren oder dass Personen, die die Ebene des Gruppierungsfaktors teilen, miteinander korreliert werden sollten (während Einzelpersonen, die nicht korreliert werden sollten) - die zufälligen Effekte erreichen dies. Wenn Sie der Meinung sind, dass Beobachtungen, die beide Ebenen gemeinsam haben participantsund contextähnlicher sind als die Summe der beiden Teile, die Einbeziehung des Zufallseffekts "Interaktion" angemessen sein kann.

Edit: Wie @Henrik in den Kommentaren erwähnt, passen die Modelle, zB:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

Stellen Sie sicher, dass die zufällige Steigung und der zufällige Achsenabschnitt miteinander korreliert sind und dass die Korrelation vom Modell geschätzt wird. Um das Modell so einzuschränken, dass die zufällige Steigung und der zufällige Achsenabschnitt nicht korreliert sind (und daher unabhängig sind, da sie normalerweise verteilt sind), passen Sie stattdessen das Modell an:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

Die Wahl zwischen diesen beiden sollte darauf beruhen, ob Sie beispielsweise der Ansicht sind, dass participants mit einer überdurchschnittlichen Grundlinie (dh einem positiven zufälligen Schnitt) wahrscheinlich auch eine höhere Änderungsrate als der Durchschnitt haben (dh eine positive zufällige Steigung). Wenn ja, würden Sie die Korrelation der beiden zulassen, wenn nicht, würden Sie die Unabhängigkeit der beiden einschränken. (Auch in diesem Beispiel wird davon ausgegangen, dass die Steigung des festen Effekts positiv ist.)

Makro
quelle
2
Ich möchte nicht wählerisch sein, aber das zweite Modell enthält auch die Korrelation zwischen dem Achsenabschnitt und den Steigungen. Nur das Hinzufügen der Pisten sollte lauten: lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)Oder irre ich mich? (Ohne Bezug: Entschuldigen Sie meine kleine Änderung Ihres Beitrags. Wenn Sie mit der Klarstellung nicht einverstanden sind, ändern Sie sie einfach zurück.)
Henrik
@ Henrik, ja du hast recht, dass es auch die Korrelation zwischen den beiden zufälligen Effekten schätzt. Beim Schreiben dieser Antwort habe ich versucht, einen Überblick darüber zu geben, was mit diesen Modellen vor sich geht, wobei die Korrelation zwischen den zufälligen Effekten nicht erwähnt wurde Auf jeden Fall glaube ich nicht, dass diese Auslassung die Interpretation, die ich in meiner Antwort gemacht habe, falsch macht. BTW, danke für die Bearbeitung.
Makro
1
@Henrik, ich habe einen Hinweis über den Unterschied zwischen Korrelieren und Nichtkorrelieren der zufälligen Effekte hinzugefügt, der meiner Meinung nach die Antwort verbessert - danke, dass Sie darauf hingewiesen haben.
Makro
Vielen Dank. Ich versuche, in die Sache der gemischten Modellierung einzusteigen, und kämpfe auch mit der Frage, wie und wann ich welche Zufallseffektstruktur verwenden soll, die ich nur sicherstellen wollte. Insgesamt eine großartige Antwort (+1).
Henrik
1
@pom, danke für das Kompliment. Betreff: Ihr Kommentar, ich habe dies an simulierten Daten getestet und ich denke, Sie haben es rückwärts. Das zweite Modell in meiner Bearbeitung hat einen Parameter weniger als das erste. Dies liegt daran, dass das zweite Modell die Korrelation zwischen den beiden Zufallseffekten auf Null einschränkt. Ansonsten sind die Modelle gleich. Ich bin nicht sicher, auf was Sie stoßen, aber ein reproduzierbares Beispiel würde helfen. Hier ist meins:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
Makro
13

@Macro hat hier eine gute Antwort gegeben, ich möchte nur einen kleinen Punkt hinzufügen. Wenn einige Personen in Ihrer Situation Folgendes verwenden:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Ich vermute, sie machen einen Fehler. Betrachten: (practice|participants)bedeutet , dass es eine zufällige Neigung (und intercept) für die Wirkung des practicefür jeden participant, während (practice|participants:context)bedeutet , dass es eine zufällige Neigung (und intercept) für die Wirkung practicefür jede participant by context Kombination . Das ist in Ordnung, wenn es das ist , was sie wollen, aber ich vermute , sie wollen (practice:context|participants), was bedeutet , dass es eine zufällige Neigung ist (und Intercept) für den Interaktionseffekt von practice by contextfür jeden participant.

gung - Wiedereinsetzung von Monica
quelle
4

In einem Modell mit zufälligen Effekten oder gemischten Effekten wird ein zufälliger Effekt verwendet, wenn Sie den beobachteten Effekt so behandeln möchten, als ob er aus einer Wahrscheinlichkeitsverteilung von Effekten abgeleitet wäre.

Eines der besten Beispiele, die ich nennen kann, ist die Modellierung klinischer Studiendaten aus einer multizentrischen klinischen Studie. Ein Site-Effekt wird häufig als zufälliger Effekt modelliert. Dies geschieht, weil die etwa 20 tatsächlich in der Studie verwendeten Standorte aus einer viel größeren Gruppe potenzieller Standorte stammen. In der Praxis war die Auswahl möglicherweise nicht zufällig, aber es kann dennoch nützlich sein, sie so zu behandeln, als ob sie es wäre.

Obwohl der Site-Effekt als fester Effekt modelliert werden könnte, wäre es schwierig, die Ergebnisse auf eine größere Population zu übertragen, wenn nicht berücksichtigt würde, dass der Effekt für einen anderen ausgewählten Satz von 20 Sites unterschiedlich wäre. Wenn wir es als zufälligen Effekt behandeln, können wir es auf diese Weise erklären.

Michael Chernick
quelle
1
-1, weil diese Antwort die eigentlichen Fragen hier nicht beantwortet.
Amöbe sagt Reinstate Monica