Varianz-Kovarianz-Matrix in lmer

18

Ich weiß, dass einer der Vorteile gemischter Modelle darin besteht, dass sie die Angabe einer Varianz-Kovarianz-Matrix für die Daten ermöglichen (zusammengesetzte Symmetrie, autoregressiv, unstrukturiert usw.). Die lmerFunktion in R ermöglicht jedoch keine einfache Angabe dieser Matrix. Weiß jemand, welche Struktur lmerstandardmäßig verwendet wird und warum es keine Möglichkeit gibt, diese einfach anzugeben?

Nikita Kuznetsov
quelle

Antworten:

9

Gemischte Modelle sind (verallgemeinerte Versionen von) Varianzkomponentenmodellen. Sie schreiben den Teil mit den festen Effekten auf, fügen Fehlerausdrücke hinzu, die für einige Beobachtungsgruppen üblich sind, und fügen bei Bedarf die Verknüpfungsfunktion hinzu.

Die verschiedenen Varianzstrukturen, die Sie beschreiben, sind jedoch die funktionierenden Korrelationsmodelle für die verallgemeinerten Schätzungsgleichungen, die einen Teil der Flexibilität der gemischten / mehrstufigen Modelle für die Robustheit der Inferenz ausgleichen. Mit GEEs sind Sie nur daran interessiert, Rückschlüsse auf den festen Teil zu ziehen, und es ist in Ordnung, die Varianzkomponenten nicht zu schätzen, wie Sie es in einem gemischten Modell tun würden. Für diese festen Effekte erhalten Sie eine robuste / Sandwich-Schätzung, die auch dann geeignet ist, wenn Ihre Korrelationsstruktur fehlerhaft ist. Die Inferenz für das gemischte Modell bricht jedoch zusammen, wenn das Modell falsch spezifiziert ist.

Obwohl es viele Gemeinsamkeiten gibt (eine mehrstufige Struktur und die Fähigkeit, verbleibende Korrelationen zu behandeln), sind gemischte Modelle und GEEs immer noch etwas unterschiedliche Verfahren. Das R-Paket, das sich mit GEEs befasst, wird entsprechend aufgerufen gee, und in der Liste der möglichen corstrOptionswerte finden Sie die von Ihnen erwähnten Strukturen.

Arbeitet aus Sicht von GEEs lmermit austauschbaren Korrelationen ... zumindest, wenn das Modell zwei Hierarchieebenen aufweist und nur zufällige Abschnitte angegeben sind.

StasK
quelle
Danke, Stas. Ich habe noch nie von GEEs gehört und nur versucht, gemischtes Modellieren zu erlernen (was schwierig ist und auch durch die Unterschiede in der Softwareimplementierung verstärkt wird). Ich werde GEE versuchen. Ich habe wirklich ein einfaches Experiment mit wiederholten Maßnahmen mit biomedizinisch abhängigen Maßnahmen. Ich interessiere mich hauptsächlich für den festen Teil. Meine vorherige Schulung befasst sich hauptsächlich mit Standard-ANOVAs mit festen Effekten, sodass der Übergang möglicherweise einfacher ist.
Nikita Kuznetsov
Ich mag die Idee, die festen Parameter abzuschätzen und habe die gee Bibliothek ausprobiert. Es gibt auch andere Bibliotheken (zum Beispiel Geopack). Sind sie aus irgendeinem Grund schlimmer? In meinem Bereich müssen Leute p-Werte melden. Gibt es eine Möglichkeit, diese aus den Schätzungen abzuleiten und auch paarweise Vergleiche unter Berücksichtigung von Clustering durchzuführen?
Nikita Kuznetsov
Paarweise Vergleiche von was? Die Vielfalt der R-Bibliotheken hat mich schon immer verrückt gemacht, und ich untersuche die Unterschiede zwischen Paketen nur dann, wenn ich wirklich an einem bestimmten Modell arbeiten muss.
StasK
StatsK, ist das wirklich richtig? Ich bin ein Anfänger in der Mehrebenenmodellierung, aber Hox (2010) oder Rabe-Hesketh & Skrondal (2013) unterscheiden klar zwischen verschiedenen Varianzschätzern über MLE und GEE. Bei der Berechnung des „robusten“ Sandwich-Standardfehlers können Sie nach Hox (S. 260) entweder über die Mehrebenenmodellierung mit der Informationsmatrix / Inversen der Hessischen Matrix (unter Berücksichtigung der Mehrebenenstruktur) oder über die Schätzung der Varianz aus berechnen rohe Residuen und anschließende Verwendung von GLS zur Berechnung der Koeffizienten (GEE-Ansatz)
Arne Jonas Warnke
1
Ich bin nicht sicher, ob die von StasK vorgeschlagene Unterscheidung hier wirklich richtig ist. Während diese alternativen Korrelationsstrukturen in der Tat von GEEs verwendet werden, ist es durchaus möglich, (vollständig parametrische) gemischte Modelle mit komplizierteren Strukturen für die Kovarianz von Zufallseffekten oder Restfehlern und das nlme-Paket in R, SAS Proc Mixed, oder anzupassen Dies tun die gemischten Befehle von Stata.
Jonathan Bartlett
4

Der FlexLamba-Zweig von lmer bietet eine solche Funktionalität.

Unter https://github.com/lme4/lme4/issues/224 finden Sie Beispiele für die Implementierung einer bestimmten Struktur von Fehlern oder zufälligen Effekten.

Majom
quelle
Kann ich sowohl den regulären als auch den FlexLambda-Zweig gleichzeitig installieren lassen? Wie?
19.
3

Soweit ich weiß, gibt es keine "einfache" Möglichkeit, dies zu ändern. Da lmer in den meisten Fällen spärliche Matrizen für die Cholesky-Faktorisierung verwendet, ist es unwahrscheinlich, dass völlig unstrukturierte VCVs möglich sind.

An Ihre Adresse Ihre Frage zu "Standardstruktur": Es gibt kein Konzept für Standard; Je nachdem, wie Sie Ihre Struktur definieren, verwenden Sie diese Struktur. Z.B. Die Verwendung von zufälligen Effekten wie: denen jeder zufällige Effekt 3 Ebenen hat, führt zu nicht verschachtelten und unabhängigen zufälligen Effekten und einer VCV-Matrix mit diagonalen zufälligen Effekten der Form:(1|ReinndEff1)+(1|ReinndEff2)

R=[σRE12000000σRE12000000σRE12000000σRE22000000σRE22000000σRE22]

Mit LMEs ist jedoch nicht alles verloren: Sie können diese VCV-Matrixattribute "leicht" angeben, wenn Sie das R-Paket MCMCglmm verwenden. Lesen Sie die CourseNotes.pdf , S. 70. Auf dieser Seite finden Sie einige Analogien zur Definition der Struktur von lme4-Zufallseffekten, aber wie Sie selbst sehen werden, ist lmer in dieser Hinsicht weniger flexibel als MCMCglmm.

Auf halbem Weg gibt es Probleme mit den Klassen corStruct von nlme, z. corCompSymm , corAR1 usw. usw. Fabians Reaktion auf dieses Profil enthält einige prägnantere Beispiele für die auf lme4 basierende VCV-Spezifikation, die jedoch, wie bereits erwähnt, nicht so explizit sind wie die in MCMCglmm oder nlme.

usεr11852 sagt Reinstate Monic
quelle
Ich "vertraue" MCMCglmm wegen der naiven Wahl der vorherigen Distributionen nicht.
Stéphane Laurent
A. Ich halte es nicht für "naiv". Sie können gültige Annahmen widerspiegeln. Sie können sogar unangemessene Prioritäten definieren, wenn Sie dies für etwas stark empfinden. B. Das war nur ein Teil meiner Antwort. Es hieß nicht, es sei der einzige Weg. Ich habe ein Beispiel für lme4 gegeben. C. Wenn Sie multivariate gemischte Effekte benötigen, ist dies neben sabreR praktisch das einzige verfügbare Paket ...
usεr11852 sagt Reinstate Monic
Entschuldigung, mein Kommentar war keine Kritik an Ihrer Antwort. Als ich "naive Prioren" sagte, sprach ich über die nicht informativen Prioren.
Stéphane Laurent
Es scheint nicht wahrscheinlich, dass diese R-Matrix richtig ist. Sogar die "klassische" ANOVA mit wiederholten Messungen erlaubt Korrelationen ungleich Null zwischen den Bedingungen (ich denke an die zusammengesetzte Symmetriematrix). Mir scheint, dass diese Matrix nur für ein Zwischensubjektdesign mit zufälliger Zuordnung mit zwei Clustern gültig wäre.
Nikita Kuznetsov
(1|ReinndEff1)+(1|ReinndEff2)