Ich frage mich, was die Unterschiede zwischen gemischten und ungemischten GLMs sind. In SPSS können Benutzer beispielsweise über das Dropdown-Menü Folgendes anpassen:
analyze-> generalized linear models-> generalized linear models
&analyze-> mixed models-> generalized linear
Gehen sie anders mit fehlenden Werten um?
Meine abhängige Variable ist binär und ich habe mehrere kategoriale und kontinuierliche unabhängige Variablen.
mixed-model
generalized-linear-model
glmm
gee
user9203
quelle
quelle
Antworten:
Das Aufkommen verallgemeinerter linearer Modelle hat es uns ermöglicht, Datenmodelle vom Regressionstyp zu erstellen, wenn die Verteilung der Antwortvariablen nicht normal ist - zum Beispiel, wenn Ihr DV binär ist. (Wenn Sie ein wenig mehr über Glims wissen möchten, habe ich eine recht umfangreiche Antwort hier , die , obwohl sie den Kontext unterscheidet sich nützlich sein kann.) Jedoch ein GLiM, zB ein logistisches Regressionsmodell, geht davon aus, dass Ihre Daten sind unabhängig . Stellen Sie sich zum Beispiel eine Studie vor, in der untersucht wird, ob ein Kind Asthma entwickelt hat. Jedes Kind steuert einen Beitrag beiDaten deuten auf die Studie hin - sie haben entweder Asthma oder sie haben kein Asthma. Manchmal sind Daten jedoch nicht unabhängig. Betrachten Sie eine weitere Studie, in der untersucht wird, ob ein Kind an verschiedenen Stellen im Schuljahr eine Erkältung hat. In diesem Fall trägt jedes Kind viele Datenpunkte bei. Zu einer Zeit könnte ein Kind erkältet sein, später vielleicht nicht, und noch später könnten sie eine weitere Erkältung haben. Diese Daten sind nicht unabhängig, da sie vom selben Kind stammen. Um diese Daten angemessen zu analysieren, müssen wir diese Nichtunabhängigkeit irgendwie berücksichtigen. Es gibt zwei Möglichkeiten: Eine Möglichkeit besteht darin, die verallgemeinerten Schätzungsgleichungen zu verwenden (die Sie nicht erwähnen, also überspringen wir sie). Der andere Weg ist die Verwendung eines verallgemeinerten linearen Mischmodells. GLiMMs können die Nichtunabhängigkeit erklären, indem sie zufällige Effekte hinzufügen (wie @MichaelChernick-Notizen). Die Antwort lautet daher, dass Ihre zweite Option nicht normale, wiederholte Messungen (oder auf andere Weise nicht unabhängige) Daten betrifft. (Im Einklang mit dem Kommentar von @ Macro sollte erwähnt werden, dass verallgemeinerte lineare gemischte Modelle lineare Modelle als Sonderfall enthalten und daher mit normalverteilten Daten verwendet werden können. In der typischen Verwendung bedeutet der Begriff jedoch nicht normale Daten.)
Update: (Das OP hat auch nach GEE gefragt, daher schreibe ich ein wenig darüber, wie alle drei miteinander in Beziehung stehen.)
Hier ist eine grundlegende Übersicht:
Da Sie mehrere Versuche pro Teilnehmer durchführen, sind Ihre Daten nicht unabhängig. Wie Sie richtig bemerken, "sind [t] Rials innerhalb eines Teilnehmers wahrscheinlich ähnlicher als im Vergleich zur gesamten Gruppe". Verwenden Sie daher entweder ein GLMM oder das GEE.
Die Frage ist also, wie Sie entscheiden können, ob GLMM oder GEE für Ihre Situation besser geeignet sind. Die Antwort auf diese Frage hängt vom Thema Ihrer Recherche ab - insbesondere vom Ziel der Schlussfolgerungen, die Sie zu ziehen hoffen. Wie ich bereits sagte, berichten die Betas bei einem GLMM über die Auswirkung einer Änderung von einer Einheit Ihrer Kovariaten auf einen bestimmten Teilnehmer aufgrund seiner individuellen Merkmale. Auf der anderen Seite informieren Sie die Betas über die Auswirkung einer Änderung um eine Einheit in Ihren Kovariaten auf den Durchschnitt der Antworten der gesamten betroffenen Bevölkerung. Diese Unterscheidung ist schwer zu fassen, insbesondere weil es bei linearen Modellen keine solche Unterscheidung gibt (in diesem Fall sind die beiden dasselbe).
Eine Möglichkeit, Ihren Kopf darum zu wickeln, besteht darin, sich vorzustellen, dass Sie den Durchschnitt über Ihre Bevölkerung auf beiden Seiten des Gleichheitszeichens in Ihrem Modell berechnen. Dies könnte beispielsweise ein Modell sein: wobei: Es gibt einen Parameter, der die Antwortverteilung regelt ( die Wahrscheinlichkeit (mit binären Daten) auf der linken Seite für jeden Teilnehmer. Auf der rechten Seite gibt es Koeffizienten für die Wirkung der Kovariable [s] und dem Basisniveau , wenn die Kovariable [s] 0 ist gleich das erste , was zu bemerken ist , dass die tatsächliche Intercept für eine bestimmte Person ist nicht , aber eher logit ( p ) = ln ( p
Stellen Sie sich vor, dass dieses Diagramm den zugrunde liegenden Datenerzeugungsprozess für die Wahrscheinlichkeit einer kleinen Klasse darstellt Eine bestimmte Anzahl von Studenten wird in der Lage sein, einen Test zu einem bestimmten Thema mit einer bestimmten Anzahl von Unterrichtsstunden zu diesem Thema zu bestehen. Jede der grauen Kurven repräsentiert die Wahrscheinlichkeit, dass einer der Schüler den Test mit unterschiedlichem Unterrichtsumfang besteht. Die fette Kurve ist der Durchschnitt über die gesamte Klasse. In diesem Fall ist der Effekt einer zusätzlichen Unterrichtsstunde , die von den Attributen des Schülers abhängig ist,
Die Frage, ob Sie ein GLMM oder das GEE verwenden sollten, ist die Frage, welche dieser Funktionen Sie schätzen möchten. Wenn Sie über die Wahrscheinlichkeit eines bestimmten Student beiläufig wissen wollte (wenn, sagen wir, Sie waren der Schüler oder die Eltern des Schülers), möchten Sie eine GLMM verwenden. Wenn Sie andererseits die Auswirkungen auf die Bevölkerung kennen möchten (wenn Sie beispielsweise der Lehrer oder der Schulleiter waren), möchten Sie das GEE verwenden.
Eine weitere mathematisch detailliertere Beschreibung dieses Materials finden Sie in der Antwort von @Macro.
quelle
Der Schlüssel ist die Einführung zufälliger Effekte. Gungs Link erwähnt es. Aber ich denke, es hätte direkt erwähnt werden sollen. Das ist der Hauptunterschied.
quelle
Ich schlage vor, Sie untersuchen auch die Antworten auf eine Frage, die ich vor einiger Zeit gestellt habe:
Allgemeines lineares Modell vs. verallgemeinertes lineares Modell (mit einer Identitätsverknüpfungsfunktion?)
quelle