Wann wird ein Mischeffektmodell verwendet?

11

Modelle mit linearen gemischten Effekten sind Erweiterungen von linearen Regressionsmodellen für Daten, die in Gruppen gesammelt und zusammengefasst werden. Der Hauptvorteil ist, dass die Koeffizienten in Bezug auf eine oder mehrere Gruppenvariablen variieren können.

Ich habe jedoch Probleme damit, wann ich ein Mischeffektmodell verwenden soll. Ich werde meine Fragen anhand eines Spielzeugbeispiels mit Extremfällen ausarbeiten.

Nehmen wir an, wir möchten Größe und Gewicht für Tiere modellieren und verwenden Arten als Gruppierungsvariable.

  • Wenn verschiedene Gruppen / Arten wirklich unterschiedlich sind. Sagen Sie einen Hund und einen Elefanten. Ich denke, es macht keinen Sinn, ein Mischeffektmodell zu verwenden. Wir sollten für jede Gruppe ein Modell erstellen.

  • Wenn verschiedene Gruppen / Arten wirklich ähnlich sind. Sagen Sie eine Hündin und einen Rüden. Ich denke, wir möchten möglicherweise das Geschlecht als kategoriale Variable im Modell verwenden.

Ich gehe also davon aus, dass wir in den mittleren Fällen ein Mischeffektmodell verwenden sollten. Angenommen, die Gruppe besteht aus Katzen, Hunden und Kaninchen. Sie sind ähnlich große Tiere, aber unterschiedlich.

Gibt es ein formales Argument, das vorschlägt, wann ein Mischeffektmodell verwendet werden soll, dh wie Linien zwischen diesen gezogen werden sollen?

  1. Erstellen von Modellen für jede Gruppe
  2. Mischeffektmodell
  3. Verwenden Sie die Gruppe als kategoriale Variable in der Regression

Mein Versuch: Methode 1 ist das "komplexeste Modell" / weniger Freiheitsgrad und Methode 3 ist das "einfachste Modell" / mehr Freiheitsgrad. Und das Mixed-Effect-Modell ist in der Mitte. Wir können überlegen, wie viele Daten und wie kompliziert Daten sind, um das richtige Modell gemäß Bais Variance Trade Off auszuwählen.

Haitao Du
quelle
5
Dies wird in vielen Threads in diesem Forum diskutiert. Hast du nach etwas gesucht? Beachten Sie, dass Ihre Option mit "kategorialer Variable" ein sogenannter "fester Effekt" (der Gruppierungsvariablen) ist, während Sie mit "gemischtes Modell verwenden" einen "zufälligen Effekt" verwenden. Sie fragen also, wann Sie einen festen und wann einen zufälligen Effekt verwenden sollen. Zu dieser Frage gibt es verschiedene Meinungen, und Sie können hier im Lebenslauf viele Diskussionen finden. Ich könnte später einige Links posten.
Amöbe sagt Reinstate Monica
Auch der Unterschied zwischen "Erstellen separater Modelle" und "Verwenden einer kategorialen Variablen" ist mir nicht klar. activity ~ condition + species + condition*species- Dies wird speciesals kategoriale Variable verwendet, entspricht jedoch einer separaten Regression activity ~ conditionfür jede Art separat.
Amöbe sagt Reinstate Monica
2
Überprüfen Sie diesen Thread: stats.stackexchange.com/questions/120964/… . Er beantwortet Ihre Frage nicht direkt, bietet jedoch eine Diskussion, die eng mit Ihrer Frage zusammenhängt.
Tim
3
Haben Sie zu Beginn stats.stackexchange.com/a/151800/28666 gelesen ?
Amöbe sagt Reinstate Monica
2
"Wenn verschiedene Gruppen / Arten wirklich unterschiedlich sind. Sagen wir einen Hund und einen Elefanten. Ich denke, es macht keinen Sinn, ein Modell mit gemischten Effekten zu verwenden, wir sollten für jede Gruppe ein Modell erstellen." Dies gilt nur dann, wenn Sie erwarten, dass sich die Auswirkungen aller anderen Merkmale je nach Art unterscheiden. Dies ist in den meisten Situationen eine zu liberale Annahme.
Matthew Drury

Antworten:

8

Ich fürchte, ich könnte die nuancierte und vielleicht unbefriedigende Antwort haben, dass es sich um eine subjektive Entscheidung des Forschers oder Datenanalysten handelt. Wie an anderer Stelle in diesem Thread erwähnt, reicht es nicht aus, einfach zu sagen, dass die Daten eine "verschachtelte Struktur" haben. Um fair zu sein, beschreiben so viele Bücher, wann mehrstufige Modelle verwendet werden müssen. Zum Beispiel habe ich gerade Joop Hox 'Buch Multilevel Analysis aus meinem Bücherregal gezogen, das diese Definition enthält:

Ein Mehrebenenproblem betrifft eine Population mit einer hierarchischen Struktur.

Selbst in einem ziemlich guten Lehrbuch scheint die ursprüngliche Definition kreisförmig zu sein. Ich denke, dies liegt teilweise an der Subjektivität der Bestimmung, wann welche Art von Modell verwendet werden soll (einschließlich eines Mehrebenenmodells).

Ein anderes Buch, West, Welch & Galeckis Linear Mixed Models, sagt, dass diese Modelle für:

Ergebnisvariablen, in denen die Residuen normal verteilt sind, aber möglicherweise nicht unabhängig sind oder eine konstante Varianz aufweisen. Zu den Studiendesigns, die zu Datensätzen führen, die mithilfe von LMMs angemessen analysiert werden können, gehören (1) Studien mit Clusterdaten, z. B. Schüler in Klassenzimmern, oder Versuchspläne mit zufälligen Blöcken, z. B. Rohstoffchargen für einen industriellen Prozess, und (2) Längsschnittstudien oder Studien mit wiederholten Messungen, bei denen Probanden wiederholt über die Zeit oder unter verschiedenen Bedingungen gemessen werden.

Finch, Bolin & Kelleys Mehrebenenmodellierung in R spricht auch über die Verletzung der iid-Annahme und der korrelierten Residuen:

Von besonderer Bedeutung im Zusammenhang mit der Mehrebenenmodellierung ist die Annahme [in der Standardregression] von unabhängig verteilten Fehlerausdrücken für die einzelnen Beobachtungen innerhalb einer Stichprobe. Diese Annahme bedeutet im Wesentlichen, dass für die abhängige Variable keine Beziehungen zwischen Personen in der Stichprobe bestehen, sobald die unabhängigen Variablen in der Analyse berücksichtigt werden.

Ich glaube, dass ein Mehrebenenmodell sinnvoll ist, wenn Grund zu der Annahme besteht, dass Beobachtungen nicht unbedingt unabhängig voneinander sind. Was auch immer "Cluster" für diese Nichtunabhängigkeit verantwortlich ist, kann modelliert werden.

Ein naheliegendes Beispiel wären Kinder in Klassenzimmern - sie interagieren alle miteinander, was dazu führen kann, dass ihre Testergebnisse nicht unabhängig sind. Was ist, wenn in einem Klassenzimmer jemand eine Frage stellt, die dazu führt, dass Material in dieser Klasse behandelt wird, das in anderen Klassen nicht behandelt wird? Was ist, wenn der Lehrer für einige Klassen wacher ist als für andere? In diesem Fall würde es eine gewisse Nichtunabhängigkeit der Daten geben. In mehrstufigen Wörtern können wir erwarten, dass eine gewisse Varianz in der abhängigen Variablen auf den Cluster (dh die Klasse) zurückzuführen ist.

Ihr Beispiel eines Hundes gegenüber einem Elefanten hängt von den unabhängigen und abhängigen Variablen ab, die von Interesse sind, denke ich. Nehmen wir zum Beispiel an, wir fragen, ob Koffein einen Einfluss auf das Aktivitätsniveau hat. Tiere aus dem ganzen Zoo werden nach dem Zufallsprinzip ausgewählt, um entweder ein koffeinhaltiges Getränk oder ein Kontrollgetränk zu erhalten.

Wenn wir ein Forscher sind, der sich für Koffein interessiert, könnten wir ein Mehrebenenmodell spezifizieren, da uns die Wirkung von Koffein wirklich wichtig ist. Dieses Modell würde wie folgt angegeben:

activity ~ condition + (1+condition|species)

Dies ist besonders hilfreich, wenn es eine große Anzahl von Arten gibt, über die wir diese Hypothese testen. Ein Forscher könnte jedoch an den artspezifischen Wirkungen von Koffein interessiert sein. In diesem Fall könnten sie Arten als festen Effekt angeben:

activity ~ condition + species + condition*species

Dies ist offensichtlich ein Problem, wenn beispielsweise 30 Arten vorhanden sind, wodurch ein unhandliches 2 x 30-Design entsteht. Sie können jedoch ziemlich kreativ werden, wie man diese Beziehungen modelliert.

Einige Forscher plädieren beispielsweise für eine noch umfassendere Verwendung der Mehrebenenmodellierung. Gelman, Hill & Yajima (2012) argumentieren, dass die Mehrebenenmodellierung als Korrektur für Mehrfachvergleiche verwendet werden könnte - selbst in experimentellen Untersuchungen, bei denen die Struktur der Daten nicht offensichtlich hierarchischer Natur ist:

Bei der Modellierung mehrerer Vergleiche mit mehr Struktur treten schwierigere Probleme auf. Angenommen, wir haben fünf Ergebnismaße, drei Arten von Behandlungen und Untergruppen, die nach zwei Geschlechtern und vier Rassengruppen klassifiziert sind. Wir möchten diese 2 × 3 × 4 × 5-Struktur nicht als 120 austauschbare Gruppen modellieren. Selbst in diesen komplexeren Situationen denken wir, dass die Mehrebenenmodellierung die klassischen Mehrfachvergleichsverfahren ersetzen sollte und wird.

Probleme können auf verschiedene Arten modelliert werden, und in mehrdeutigen Fällen scheinen mehrere Ansätze ansprechend zu sein. Ich denke, unsere Aufgabe ist es, einen vernünftigen, informierten Ansatz zu wählen und dies transparent zu tun.

Mark White
quelle
5

Sie können natürlich ein Modell für jede Gruppe erstellen, daran ist nichts auszusetzen. Sie benötigen jedoch eine größere Stichprobe und müssen mehrere Modelle verwalten.

Durch die Verwendung eines gemischten Modells bündeln (und teilen) Sie die Daten und benötigen daher eine kleinere Stichprobengröße.

Damit teilen wir die statistische Stärke. Die Idee hier ist, dass etwas, auf das wir in einer Datengruppe gut schließen können, uns bei etwas helfen kann, auf das wir in einer anderen nicht gut schließen können.

Gemischte Modelle verhindern auch, dass überabgetastete Gruppen die Inferenz unfair dominieren.

Mein Punkt ist, wenn Sie die zugrunde liegende latente hierarchische Struktur modellieren möchten, sollten Sie Ihrem Modell zufällige Effekte hinzufügen. Andernfalls verwenden Sie es nicht, wenn Sie sich nicht für Ihre Modellinterpretation interessieren.

https://www.dropbox.com/s/rzi2rsou6h817zz/Datascience%20Presentation.pdf?dl=0

gibt relevante Diskussion. Der Autor diskutierte, warum er keine separaten Regressionsmodelle ausführen wollte.

Geben Sie hier die Bildbeschreibung ein

Hallo Welt
quelle
4

In Modellen mit gemischten Effekten fügen Sie Ihrem Modell zufällige (Fehler-) Begriffe hinzu, sodass Sie feste und zufällige Effekte "mischen". Ein anderer Ansatz, um zu überlegen, wann Modelle mit gemischten Effekten verwendet werden sollen, könnte darin bestehen, zu untersuchen, was ein "zufälliger Effekt" ist. Daher finde ich neben den zuvor gegebenen Antworten auch die Unterscheidung zwischen den Begriffen "feste" und "zufällige" Effekte aus Bates (2010) aufschlussreich, Abschnitt 1.1 (insbesondere Seite 2).

Parameter, die den bestimmten Ebenen einer Kovariate zugeordnet sind, werden manchmal als „Effekte“ der Ebenen bezeichnet. Wenn die Menge der möglichen Ebenen der Kovariate fest und reproduzierbar ist , modellieren wir die Kovariate unter Verwendung von Parametern mit festen Effekten. Wenn die beobachteten Ebenen eine Zufallsstichprobe aus der Menge aller möglichen Ebenen darstellen, nehmen wir zufällige Effekte in das Modell auf. Bei dieser Unterscheidung zwischen Parametern mit festen Effekten und zufälligen Effekten sind zwei Dinge zu beachten. Erstens sind die Namen irreführend, da die Unterscheidung zwischen fest und zufällig eher eine Eigenschaft der Ebenen der kategorialen Kovariate als eine Eigenschaft der damit verbundenen Effekte ist.

Diese Definition gilt häufig für einige hierachische Strukturen wie Länder oder Klassenzimmer, da Sie immer eine "zufällige" Stichprobe von Ländern oder Klassenzimmern haben - Daten wurden nicht aus allen möglichen Ländern oder Klassenzimmern gesammelt .

Das Geschlecht ist jedoch festgelegt (oder wird zumindest als festgelegt behandelt). Wenn Sie männliche oder weibliche Personen haben, gibt es keine anderen Geschlechtsstufen mehr (es kann einige geschlechtsspezifische Ausnahmen geben, dies wird jedoch meistens ignoriert).

Oder sagen Sie Bildungsniveau: Wenn Sie fragen, ob Personen eine niedrigere, mittlere oder höhere Bildung haben, sind keine Stufen mehr vorhanden, sodass Sie nicht eine "zufällige" Stichprobe aller möglichen Bildungsstufen gezogen haben (daher ist dies ein fester Effekt).

Daniel
quelle
2
+1 Warum die Abstimmung? Es ist ein Zitat eines angesehenen Statistikers zur Modellierung von Zufallseffekten. Der folgende Kommentar ist ziemlich einfach und
klar
3

Sie verwenden gemischte Modelle, wenn auf der Grundlage des Studiendesigns einige vernünftige Annahmen über die Art der Korrelation zwischen Beobachtungen und Inferenz auf individueller Ebene oder unter bedingten Effekten getroffen werden können. Gemischte Modelle ermöglichen die Spezifikation von Zufallseffekten, die eine bequeme Darstellung von Korrelationsstrukturen darstellen, die bei der Datenerfassung auf natürliche Weise auftreten.

Der häufigste Typ eines gemischten Modells ist ein Zufallsschnittmodell, das eine latente Verteilung gemeinsamer Konstanten mit einer 0-Mittelwert-Normalverteilung mit endlicher Varianz innerhalb von im Datensatz identifizierten Clustern von Individuen schätzt. Dieser Ansatz berücksichtigt möglicherweise Hunderte von Störfaktoren, die Beobachtungsgruppen oder Clustern gemeinsam sind, sich jedoch zwischen den Clustern unterscheiden.

Ein zweiter üblicher Typ eines gemischten Modells ist ein Zufallssteigungsmodell, das ähnlich wie das Zufallsabschnittsmodell eine latente Verteilung von Zeit-Prädiktor-Wechselwirkungen schätzt, die wiederum aus einer 0-Mittelwert-Normalverteilung mit endlicher Varianz innerhalb einer Panel-Studie oder aus Clustern stammt von Beobachtungen, die prospektiv oder in Längsrichtung gemessen wurden.

Diese Ergebnisse ähneln in etwa den Ergebnissen, die aus der Verwendung verallgemeinerter kleinster Quadrate und des EM-Algorithmus zur iterativen Schätzung von Modellparametern und der Kovarianz zwischen diesen abhängigen Beobachtungen (oder genauer ihren Residuen) erhalten wurden. Die gewichteten kleinsten Quadrate sind effizienter als die kleinsten Quadrate, wenn die Kovarianz zwischen den Beobachtungen bekannt ist. Während die Kovarianz selten bekannt ist, kann angenommen werden, dass sie eine bestimmte Struktur annimmt und iterativ geschätzt wird. Das Zufallsschnittmodell liefert ähnliche Schlussfolgerungen und Wahrscheinlichkeiten für gewichtete kleinste Quadrate mit einer austauschbaren Korrelationsstruktur, wobei wennY 1 , Y 2 c o r ( Y t , Y s ) = ρ | t - s | Y t , Y s t , scor(Y1,Y2)=ρY1,Y2befinden sich im selben Cluster und ansonsten 0. Das Zufallssteigungsmodell liefert ähnliche Schlussfolgerungen und Wahrscheinlichkeiten für gewichtete kleinste Quadrate mit einer autoregressiven 1-Korrelationsstruktur, wobei wenn Beobachtungen an derselben Probe zu verschiedenen Zeitpunkten und 0 sonst. Die Ergebnisse sind nicht identisch, da der zufällige Schnitt die Beobachtungen innerhalb von Clustern positiv assoziiert, was fast immer eine vernünftige Annahme ist.cor(Yt,Ys)=ρ|ts|Yt,Yst,s

Individuelle oder bedingte Effekte können dem Bevölkerungsniveau oder marginalen Effekten gegenübergestellt werden. Randeffekte repräsentieren den Effekt einer Intervention oder eines Screenings in einer Population. Als Beispiel kann eine Intervention zur Verbesserung der Compliance bei der Rehabilitation nach Drogenmissbrauch die Teilnahme an einer Gruppe von Patienten über 3 Monate unter verschiedenen Bedingungen untersuchen. Die Nutzungsdauer kann zwischen den Patienten variieren und die Einhaltung des Workshops stark vorhersagen, wenn Teilnehmer mit längerer Nutzungsdauer eine größere Suchtneigung und -vermeidung aufweisen. Eine Analyse auf individueller Ebene kann ergeben, dass die Studie effektiv ist, obwohl Teilnehmer mit längerer Sucht vor Erhalt der Intervention nicht anwesend waren und nach Erhalt der Intervention weiterhin nicht anwesend waren.

Randeffekte haben eine weniger genaue Schlussfolgerung, da die Homogenität zwischen Clustern in Zeit oder Raum ignoriert wird. Sie können mit verallgemeinerten Schätzgleichungen oder durch Marginalisierung der gemischten Modelle geschätzt werden.

AdamO
quelle
2
+1, ich wünschte ich könnte 2 Antworten akzeptieren!. Mein Kommentar zu @ Marks Antwort gilt auch für Ihre Antwort. dass Sie mir geholfen haben zu verstehen, wie wir "Beobachtung in Clustern" definieren
Haitao Du
2
@ hxd1011 Es kommt ausschließlich aus einer Aussage über das Studiendesign. Jedes Design mit geschichteten Stichproben oder Wiederholungsmessungen enthält nicht unabhängige Daten. Dies ist kein Fall für statistische Tests. Das Melden oder zumindest Untersuchen der zufälligen Effekte kann helfen, das Ausmaß der Korrelation zu verstehen. Ein ICC ist ein Beispiel für eine solche Maßnahme.
AdamO
0

Mixed-Effekte sollten verwendet werden, wenn Daten eine verschachtelte oder hierarchische Struktur haben. Dies verstößt tatsächlich gegen die Annahme der Unabhängigkeit von Messungen, da alle Messungen innerhalb derselben Gruppe / Ebene korreliert sind. Im Falle von

"Wenn verschiedene Gruppen / Arten wirklich ähnlich sind. Sagen Sie eine Hündin und einen Rüden. Ich denke, wir möchten möglicherweise das Geschlecht als kategoriale Variable im Modell verwenden."

Das Geschlecht wäre faktorvariabel und ein fester Effekt, während die Variabilität der Hundegrößen innerhalb des Geschlechts ein zufälliger Effekt ist. Mein Modell wäre

response ~ sex + (1|size), data=data

Intuitiv sollten Kaninchen, Hunde und Katzen getrennt modelliert werden, da die Größen von Hund und Katze nicht korrelieren. Die Größe von zwei Hunden ist jedoch eine Art Variabilität innerhalb der Spezies.

Marianess
quelle
Ich persönlich halte den Begriff "verschachtelte oder hierarchische Struktur" für zu allgemein und finde es schwierig, Grenzen zu definieren.
Haitao Du
Vielleicht hast du recht. Ich denke, dann werden LMM verwendet, wenn die Annahme von IID aufgrund einer in den Daten vorhandenen Gruppierung verletzt wird.
Marianess