Was ist der Unterschied zwischen verallgemeinerten Schätzgleichungen und GLMM?

27

Ich verwende ein GEE mit 3-Level-Daten, die nicht ausbalanciert sind, und benutze einen Logit-Link. Wie unterscheidet sich dies (in Bezug auf die Schlussfolgerungen, die ich ziehen kann, und die Bedeutung der Koeffizienten) von einem GLM mit gemischten Effekten (GLMM) und einem Logit-Link?

Weitere Einzelheiten: Die Beobachtungen sind einzelne Bernoulli-Versuche. Sie sind in Klassenräumen und Schulen zusammengefasst. Mit R. Casewise Weglassen von NAs. 6 Prädiktoren auch Interaktionsterme.

(Ich drehe keine Kinder herum, um zu sehen, ob sie Heads-Up landen.)

Ich bin geneigt, die Koeffizienten zu Odds-Ratios zu potenzieren. Hat das in beiden die gleiche Bedeutung?

In meinem Hinterkopf lauert etwas über "marginale Mittel" in GEE-Modellen. Das muss ich mir erklären lassen.

Vielen Dank.

Rosser
quelle

Antworten:

44

In Bezug auf die Interpretation der Koeffizienten gibt es (unter anderem) einen Unterschied im Binärfall. Was sich zwischen GEE und GLMM unterscheidet, ist das Ziel der Inferenz: bevölkerungsdurchschnittlich oder fachspezifisch .

Betrachten wir ein einfaches erfundenes Beispiel, das mit Ihrem verwandt ist. Sie möchten die Ausfallrate zwischen Jungen und Mädchen in einer Schule modellieren. Wie bei den meisten (Grund-) Schulen ist die Schülerbevölkerung in Klassenräume unterteilt. Sie beobachten eine binäre Antwort von n i Kindern in N Klassenzimmern (dh N i = 1 n i binäre Antworten, die nach Klassenzimmern gruppiert sind), wobei Y i j = 1, wenn der Schüler j aus dem Klassenzimmer i bestand, und Y i j = 0, wenn er /Sie versagte. Und xYniNi=1NniYij=1jiYij=0wenn der Schülerjaus dem Klassenzimmerimännlich ist und sonst 0.xij=1ji

Um die im ersten Absatz verwendete Terminologie wiederzugeben, können Sie sich die Schule als die Bevölkerung und die Klassenräume als die Fächer vorstellen .

Betrachten Sie zuerst GLMM. GLMM passt ein Modell mit gemischten Effekten an. Die Modellbedingungen in der festen Entwurfsmatrix (die in diesem Fall aus dem Achsenabschnitt und dem Indikator für das Geschlecht besteht) und alle zufälligen Effekte in den Klassenräumen, die wir in das Modell einbeziehen. In unserem Beispiel nehmen wir einen zufälligen Abschnitt , der die Grunddifferenzen bei der Ausfallrate zwischen Klassenräumen berücksichtigt. Also modellieren wirbi

log(P(Yij=1)P(Yij=0)xij,bi)=β0+β1xij+bi

bi

GEE passt dagegen ein Randmodell an. Diese modellhaften Bevölkerungsdurchschnitte . Sie modellieren die Erwartungshaltung nur nach Ihrer festen Entwurfsmatrix.

log(P(Yij=1)P(Yij=0)xij)=β0+β1xij

Dies steht im Gegensatz zu den oben erläuterten Mischeffektmodellen, die sowohl für die feste Entwurfsmatrix als auch für die Zufallseffekte gelten. Mit dem obigen Randmodell sagen Sie also: "Vergessen Sie den Unterschied zwischen den Klassenzimmern, ich möchte nur die (schulische) Versagensrate der Bevölkerung und ihre Assoziation mit dem Geschlecht." Sie passen zum Modell und erhalten eine Odds Ratio, die der bevölkerungsdurchschnittlichen Odds Ratio des geschlechtsspezifischen Versagens entspricht.

Sie können also feststellen, dass Ihre Schätzungen von Ihrem GEE-Modell möglicherweise von Ihren Schätzungen Ihres GLMM-Modells abweichen, und das liegt daran, dass sie nicht dasselbe schätzen.

(Was die Konvertierung von log-odds-ratio zu odds-ratio durch Exponentiieren betrifft, tun Sie dies, unabhängig davon, ob es sich um eine bevölkerungsbezogene oder eine fachspezifische Schätzung handelt.)

Einige Anmerkungen / Literatur:

Für den linearen Fall sind die Schätzungen für den Bevölkerungsdurchschnitt und die themenspezifischen Schätzungen gleich.

Zeger et al. 1988 zeigte, dass für die logistische Regression,

βM[(16315π)2V+1]1/2βRE

βMβREV

Molenberghs, Verbeke 2005 enthält ein ganzes Kapitel über Modelle mit Random-Effekten.

Ich habe in einem Kurs, der sehr stark von Diggle, Heagerty, Liang, Zeger 2002 abhängt, viel über dieses und verwandtes Material gelernt - eine großartige Referenz.


quelle
1
Mike: Ist es zu einfach zu sagen, dass ein GEE den Durchschnitt über die zufälligen Effekte bildet?
B_Miner
3
@B_Miner Gar nicht so einfach, genau das machst du :)
3
@ Mike Wierzbicki: Schöne und saubere Antwort, Mike! Ein kleines Detail, das ich in Ihrem "Some Notes / Literature" hinzufügen könnte: GEE und GLMM sind im linearen Fall (Gaußsche Antwort, Identitätslink) nur dann gleich, wenn Sie eine austauschbare Korrelationsmatrix für das GEE angeben.
Gibt es nicht auch ein fachspezifisches GEE?
Giordano
@MikeWierzbicki Wenn ich Sie also richtig verstehe, ist ein GEE nichts anderes als ein einfaches Modell mit gemischten Effekten ohne zufällige Effekte (wodurch es zu einer einfachen nichtlinearen Regressionslinie wird)?
Robin Kramer