Randmodell versus Zufallseffektmodell - wie kann man zwischen ihnen wählen? Ein Rat für einen Laien

11

Bei der Suche nach Informationen über das Randmodell und das Zufallseffektmodell und wie man zwischen ihnen wählt, habe ich einige Informationen gefunden, aber es war mehr oder weniger eine mathematisch abstrakte Erklärung (wie zum Beispiel hier: https: //stats.stackexchange .com / a / 68753/38080 ). Irgendwo habe ich festgestellt, dass zwischen diesen beiden Methoden / Modellen ( http://www.biomedcentral.com/1471-2288/2/15/ ) erhebliche Unterschiede zwischen Parameterschätzungen festgestellt wurden , das Gegenteil wurde jedoch von Zuur et al . (2009, S. 116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6). Das Randmodell (verallgemeinerter Schätzgleichungsansatz) liefert bevölkerungsgemittelte Parameter, während die Ergebnisse des Zufallseffektmodells (verallgemeinertes lineares gemischtes Modell) den Zufallseffekt - Subjekt berücksichtigen (Verbeke et al. 2010, S. 49–52; http: / /link.springer.com/chapter/10.1007/0-387-28980-1_16 ).

Ich würde gerne eine Laien-ähnliche Erklärung dieser Modelle sehen, die an einigen Modellbeispielen (im realen Leben) in einer Sprache illustriert ist, die Nicht-Statistikern und Nicht-Mathematikern vertraut ist.

Im Detail würde ich gerne wissen:

Wann sollte ein Randmodell verwendet werden und wann sollte ein Zufallseffektmodell verwendet werden? Für welche wissenschaftlichen Fragen eignen sich diese Modelle?

Wie sind die Ergebnisse dieser Modelle zu interpretieren?

Benjamin Jarcuska
quelle

Antworten:

14

Vielen Dank für die Verknüpfung meiner Antwort! Ich werde versuchen, eine explizite Erklärung zu geben. Diese Frage wurde auf dieser Site schon oft diskutiert (siehe die entsprechenden Fragen auf der rechten Seite), ist aber für einen "Laien" wirklich verwirrend und wichtig.

Erstens stimmen bei linearen Modellen (kontinuierliche Reaktion) die Schätzungen von Rand- und bedingten Modellen (Zufallseffekte) überein. Daher werde ich mich auf nichtlineare Modelle konzentrieren, insbesondere auf die logistische Regression für Binärdaten.

Wissenschaftliche Fragen

Das am häufigsten verwendete Beispiel zur Unterscheidung von Rand- und Bedingungsmodellen ist:

Wenn Sie ein sind Arzt und Sie wollen eine Schätzung, wie viel ein Statin Ihrer Patienten Chancen auf einen Herzinfarkt senken wird, die fachspezifischen Koeffizienten ist die klare Wahl. Wenn Sie jedoch ein staatlicher Gesundheitsbeamter sind und wissen möchten, wie sich die Anzahl der Menschen, die an Herzinfarkten sterben, ändern würde, wenn jeder in der Risikopopulation das Fleckendroge einnimmt, möchten Sie wahrscheinlich die Bevölkerung verwenden –Gemittelte Koeffizienten. (Allison, 2009)

Die beiden Arten von wissenschaftlichen Fragen entsprechen diesen beiden Modellen.

Illustration

Das beste Beispiel, das ich bisher gesehen habe, ist die folgende Abbildung in Applied Longitudinal Analysis ( Fitzmaurice, Laird and Ware, 2011 , Seite 479), wenn wir die Kovariate von "Statin Drug" in "Time" ändern. Es ist klar, dass sich die beiden Modelle in der Koeffizientenskala unterscheiden, was im Wesentlichen durch die Tatsache erklärt werden kann, dass der Mittelwert einer nichtlinearen Funktion einer Zufallsvariablen nicht gleich der nichtlinearen Funktion des Mittelwerts ist.

Geben Sie hier die Bildbeschreibung ein

Deutung

In der obigen Abbildung stammen die gepunkteten Linien aus einem zufälligen Schnittmodell. Es zeigt, dass wir die Zufallseffektkonstante bei der Interpretation der festen Effekte steuern müssen, dh nur bei der Interpretation der Steigung entlang einer Linie gehen müssen. Aus diesem Grund nennen wir die Schätzungen aus Zufallseffektmodellen "fachspezifisch". Speziell,

  • Für bedingte Modelle lautet die Interpretation: Wie würden sich die logarithmischen Quoten mit einer Zeitänderung von einer Einheit für ein bestimmtes Thema ändern? (Siehe Seite 403 von Fitzmaurice, Laird und Ware (2011) zur Diskussion darüber, warum die Interpretation zeitinvarianter Kovariaten in bedingten Modellen möglicherweise irreführend ist.)
  • Für Randmodelle ist die Interpretation genau die gleiche wie die Interpretation linearer Regressionen, dh wie würden sich die logarithmischen Quoten mit einer Änderung der Zeiteinheit oder das logarithmische Quotenverhältnis von Medikament zu Placebo ändern.

Es gibt ein weiteres Beispiel auf dieser Website.

Randel
quelle
Vielen Dank für die nette Antwort! Ich habe noch eine Frage: Sie haben geschrieben, dass die Schätzungen von Rand- und Zufallseffektmodellen für lineare Modelle übereinstimmen - gilt dies auch für Zufallseffektmodelle mit zufälligen Abschnitten und Steigungen, wenn es Unterschiede in den zufälligen Steigungen gibt?
Benjamin Jarcuska
2
Ja, die Schätzungen für die festen Effekte im Zufallseffektmodell und die Schätzungen für das Mittelwertmodell in Randmodellen stimmen unabhängig von der Struktur der Zufallseffekte überein.
Randel
Haben Sie sich nur gefragt, ob vielleicht jemand ein funktionierendes Beispiel für beide Modellierungsansätze in R hat? Vielleicht für dieses spezielle Beispiel, da es ziemlich didaktisch erscheint?
Tom Wenseleers