Angenommen, ich habe eine Antwortvariable , die vom ten Geschwister in der ten Familie gemessen wurde . Darüber hinaus sind einige Verhaltensdaten in der gleichen Zeit von jedem Probanden erhoben wurden. Ich versuche die Situation mit dem folgenden linearen Mixed-Effects-Modell zu analysieren:
wobei und α 1 der feste Schnittpunkt bzw. die Steigung sind, δ 1 i die zufällige Steigung ist und ε i j der Rest ist.
Die Annahmen für die Zufallseffekte und Residuum ε i j sind (vorausgesetzt, es gibt nur zwei Geschwister in jeder Familie).
wobei ein unbekannter Varianzparameter ist und die Varianz-Kovarianz-Struktur R eine 2 × 2 symmetrische Formmatrix ist
das modelliert die Korrelation zwischen den beiden Geschwistern.
Ist dies ein geeignetes Modell für eine solche Geschwisterstudie?
Die Daten sind etwas kompliziert. Unter den 50 Familien sind fast 90% zweieiige Zwillinge. Für die übrigen Familien
- zwei haben nur ein geschwister;
- zwei haben ein DZ-Paar plus ein Geschwister; und
- zwei haben ein DZ-Paar plus zwei zusätzliche Geschwister.
Ich glaube, dass
lme
das R-Paketnlme
problemlos mit (1) fehlenden oder unausgeglichenen Situationen umgehen kann. Mein Problem ist, wie ich mit (2) und (3) umgehen soll. Eine Möglichkeit, die ich mir vorstellen kann, besteht darin, jede dieser vier Familien in (2) und (3) in zwei zu unterteilen, sodass jede Unterfamilie ein oder zwei Geschwister haben würde, sodass das obige Modell weiterhin angewendet werden könnte. Ist das in Ordnung? Eine andere Möglichkeit wäre, die Daten von den zusätzlichen ein oder zwei Geschwistern in (2) und (3) einfach wegzuwerfen, was eine Verschwendung zu sein scheint. Irgendwelche besseren Ansätze?Es scheint,
lme
dass man die Werte in der Restvarianz-Kovarianz-Matrix R festlegen kann , zum Beispiel r 2 12 = 0,5. Ist es sinnvoll, die Korrelationsstruktur festzulegen, oder sollte ich sie einfach anhand der Daten schätzen?
lme
Antworten:
Sie können Zwillinge und Nicht-Zwillinge in ein einheitliches Modell einbeziehen, indem Sie eine Dummy-Variable verwenden und zufällige Steigungen in diese Dummy-Variable einbeziehen. Da alle Familien höchstens eine Zwillingsfamilie haben, ist dies relativ einfach:
Sei wenn das Geschwister j in der Familie i ein Zwilling ist, andernfalls 0. Ich gehe davon aus, dass Sie auch möchten, dass sich die zufällige Steigung für Zwillinge und normale Geschwister unterscheidet. Wenn nicht, schließen Sie η i 3 nicht einAij=1 j i ηi3 Term in das nachstehende Modell ein.
Dann passen Sie das Modell an:
sind feste Effekte, wie in Ihrer Spezifikationα0,α1
ist der zufällige Geschwister-Grundeffekt und η i 1 ist der zusätzliche zufällige Effekt, mit dem Zwillinge ähnlicher sind als normale Geschwister. Die Größen der entsprechenden zufälligen Effektvarianzen quantifizieren, wie ähnlich die Geschwister sind und wie viel ähnlicher die Zwillinge als normale Geschwister sind. Beachten Sie, dass sowohl Zwillings- als auch Nicht-Zwillingskorrelationen durch dieses Modell charakterisiert werden - Zwillingskorrelationen werden berechnet, indem Zufallseffekte entsprechend summiert werden (Einstecken von A i j = 1 ).ηi0 ηi1 Aij=1
und η i 3 haben analoge Rollen, nur wirken sie als zufällige Steigungen von x i jηi2 ηi3 xij
Sie können das Modell unter Verwendung des
R
Pakets anpassenlme4
. Im folgenden Code ist die abhängige Variabley
, die Dummy-Variable istA
, der Prädiktor istx
, das Produkt der Dummy-Variable und der Prädiktor istAx
undfamID
ist die Identifikationsnummer für die Familie. Es wird davon ausgegangen, dass Ihre Daten in einem DatenrahmenD
mit diesen Variablen als Spalten gespeichert sind.Die Zufallseffektvariablen und die Schätzungen der festen Effekte können durch Eingabe angezeigt werden
summary(g)
. Beachten Sie, dass mit diesem Modell die zufälligen Effekte frei miteinander korreliert werden können.In vielen Fällen kann es sinnvoller (oder leichter zu interpretieren) sein, eine Unabhängigkeit zwischen den zufälligen Effekten anzunehmen (z. B. wird diese Annahme häufig getroffen, um die Korrelation zwischen genetischer und familiärer Umwelt zu zerlegen). In diesem Fall würden Sie stattdessen tippen
quelle