Welche praktischen und interpretationsbezogenen Auswirkungen hat das Schätzen in einem mehrstufigen Modell im Vergleich zum Nichtschätzen von Korrelationsparametern für zufällige Effekte? Der praktische Grund, dies zu erfragen, ist, dass es im früheren Framework in R keine implementierte Methode zum Schätzen von p-Werten über MCMC-Techniken gibt, wenn Schätzungen im Modell der Korrelationen zwischen Parametern vorgenommen werden.
Wenn Sie sich zum Beispiel dieses Beispiel (Abschnitte unten) ansehen, welche praktischen Auswirkungen haben M2 und M3? Offensichtlich wird in einem Fall P5 nicht geschätzt und im anderen Fall.
Fragen
- Aus praktischen Gründen (dem Wunsch, durch MCMC-Techniken einen p-Wert zu erhalten) kann es sinnvoll sein, ein Modell ohne Korrelationen zwischen zufälligen Effekten anzupassen, auch wenn P5 im Wesentlichen nicht Null ist. Wenn man dies tut und dann die p-Werte mit der MCMC-Technik schätzt, sind die Ergebnisse interpretierbar? (Ich weiß @ Ben Bolker zuvor erwähnt , dass „ die Kombination von Signifikanztests mit MCMC ist ein wenig zusammenhanglos, statistisch gesehen , obwohl ich den Drang zu verstehen , dies zu tun (immer Konfidenzintervall ist mehr erträglich)“ , also , wenn es Sie besser schlafen nachts so tun, als hätte ich vertrauensintervalle angegeben.)
- Wenn man P5 nicht abschätzen kann, ist das dasselbe, als wenn man behauptet, es sei 0?
- Wenn P5 wirklich nicht Null ist, wie werden dann die geschätzten Werte von P1-P4 beeinflusst?
- Wenn P5 wirklich ungleich Null ist, wie werden dann die Fehlerschätzungen für P1-P4 beeinflusst?
- Wenn P5 wirklich nicht Null ist, inwiefern sind Interpretationen eines Modells, die P5 nicht enthalten, fehlerhaft?
Ausgeborgt von der Antwort von @Mike Lawrence (diejenigen, die mehr wissen als ich, können dies durch die vollständige Modellnotation ersetzen, ich bin nicht ganz sicher, dass ich dies mit angemessener Genauigkeit tun kann):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(Schätzungen P1 - P4)
M3: V1 ~ (1+V3|V2) + V3
(Schätzungen P1-P5)
Parameter, die geschätzt werden könnten:
P1 : Ein globaler Schnittpunkt
P2 : Zufällige Effektabschnitte für V2 (dh für jede Ebene von V2 die Abweichung des Abschnitts dieser Ebene vom globalen Abschnitt)
P3 : Eine einzelne globale Schätzung für den Effekt (Steigung) von V3
P4 : Der Effekt von V3 in jeder Ebene von V2 (genauer gesagt, der Grad, in dem der V3-Effekt in einer bestimmten Ebene vom globalen Effekt von V3 abweicht), während eine Null-Korrelation zwischen den Intercept-Abweichungen und den V3-Effekt-Abweichungen über Ebenen hinweg erzwungen wird von V2.
P5 : Die Korrelation zwischen Schnittabweichungen und V3-Abweichungen über Ebenen von V2
Antworten, die aus einer ausreichend großen und umfassenden Simulation zusammen mit dem zugehörigen Code in R unter Verwendung von lmer abgeleitet wurden, wären akzeptabel.
quelle
Antworten:
Berücksichtigen Sie die Schlafstudiendaten, die in lme4 enthalten sind. Bates diskutiert dies in seinem Online- Buch über lme4. In Kapitel 3 betrachtet er zwei Modelle für die Daten.
und
Die Studie umfasste 18 Probanden, die über einen Zeitraum von 10 Tagen ohne Schlaf untersucht wurden. Die Reaktionszeiten wurden zu Beginn und an den folgenden Tagen berechnet. Es gibt einen deutlichen Effekt zwischen der Reaktionszeit und der Dauer des Schlafentzugs. Es gibt auch signifikante Unterschiede zwischen den Probanden. Modell A erlaubt die Möglichkeit einer Wechselwirkung zwischen zufälligen Intercept- und Slope-Effekten: Stellen Sie sich vor, dass Menschen mit schlechten Reaktionszeiten stärker unter den Auswirkungen von Schlafentzug leiden. Dies würde eine positive Korrelation in den Zufallseffekten implizieren.
In Bates 'Beispiel gab es keine offensichtliche Korrelation aus dem Gitterplot und keinen signifikanten Unterschied zwischen den Modellen. Um die oben gestellte Frage zu untersuchen, entschloss ich mich jedoch, die angepassten Werte der Schlafstudie zu verwenden, die Korrelation zu verbessern und die Leistung der beiden Modelle zu untersuchen.
Wie Sie auf dem Bild sehen können, sind lange Reaktionszeiten mit einem größeren Leistungsverlust verbunden. Die für die Simulation verwendete Korrelation betrug 0,58
Ich habe 1000 Proben mit der Simulationsmethode in lme4 simuliert, basierend auf den angepassten Werten meiner künstlichen Daten. Ich passte M0 und Ma aneinander an und schaute mir die Ergebnisse an. Der ursprüngliche Datensatz enthielt 180 Beobachtungen (10 für jede von 18 Personen), und die simulierten Daten hatten dieselbe Struktur.
Das Fazit ist, dass es sehr wenig Unterschiede gibt.
Warum passiert das? @gung vermutete vernünftigerweise, dass das Versäumnis, die Möglichkeit einer Korrelation zu berücksichtigen, dazu führt, dass die zufälligen Effekte unkorreliert bleiben. Vielleicht sollte es so sein; Bei dieser Implementierung können die zufälligen Effekte jedoch korreliert werden, was bedeutet, dass die Daten die Parameter unabhängig vom Modell in die richtige Richtung ziehen können. Die Unrichtigkeit des falschen Modells zeigt sich in der Wahrscheinlichkeit, weshalb Sie die beiden Modelle auf dieser Ebene (manchmal) unterscheiden können. Das Mixed-Effects-Modell passt im Grunde genommen lineare Regressionen an jedes Subjekt an, die davon abhängen, wie das Modell sie für angebracht hält. Das falsche Modell erzwingt die Anpassung weniger plausibler Werte als das richtige Modell. Letztendlich werden die Parameter jedoch von der Anpassung an die tatsächlichen Daten bestimmt.
Hier ist mein etwas klobiger Code. Die Idee war, die Schlafstudiendaten anzupassen und dann einen simulierten Datensatz mit den gleichen Parametern, aber einer größeren Korrelation für die zufälligen Effekte zu erstellen. Dieser Datensatz wurde in simulate.lmer () eingespeist, um 1000 Proben zu simulieren, von denen jede in beide Richtungen angepasst wurde. Sobald ich angepasste Objekte gepaart hatte, konnte ich mithilfe von T-Tests oder was auch immer verschiedene Merkmale der Anpassung herausziehen und vergleichen.
quelle
Placidia hat bereits eine gründliche Antwort mit simulierten Daten basierend auf dem
sleepstudy
Datensatz gegeben. Hier ist eine andere (weniger strenge) Antwort, die auch diesleepstudy
Daten verwendet.Wir sehen, dass man die geschätzte Korrelation zwischen dem zufälligen Schnittpunkt und der zufälligen Steigung beeinflussen kann, indem man die zufällige Prädiktorvariable "verschiebt". Schauen Sie sich die Ergebnisse von Modellen
fm1
undfm2
unten an:Aus der Modellausgabe sehen wir, dass sich die zufällige Varianzkorrelation geändert hat. Die Steigungen (fest und zufällig) blieben jedoch ebenso wie die Restvarianzschätzung gleich. Die (festen und zufälligen) Abschnittsschätzungen änderten sich als Reaktion auf die verschobene Variable.
De-Korrelation Zufalls Intercept-Slope - Kovarianz für LMMs ist Dr. Jack Weiss Skriptum diskutiert hier . Weiss merkt an, dass das Reduzieren der Varianzkorrelation auf diese Weise unter anderem manchmal zur Modellkonvergenz beitragen kann.
Das obige Beispiel variiert die zufällige Korrelation (Parameter "P5"). Aus der obigen Ausgabe geht hervor, dass der dritte Teil des OPs wie folgt behandelt wird:
quelle