Schreiben der mathematischen Gleichung für ein Modell mit gemischten Effekten auf mehreren Ebenen

15

Die Frage zum Lebenslauf

Ich versuche, (eine) detaillierte und präzise mathematische Darstellung (en) eines gemischten Effektmodells zu geben. Ich verwende das lme4Paket in R. Was ist die richtige mathematische Darstellung für mein Modell?


Die Daten, die wissenschaftliche Frage und der R-Code

Mein Datensatz besteht aus Arten in verschiedenen Regionen. Ich teste, ob sich die Prävalenz einer Art in der Zeit vor dem Aussterben ändert (Aussterben ist nicht unbedingt permanent; es kann sich neu besiedeln) oder nach einer Besiedlung.

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

  • Die Prävalenz ist der Anteil der Schichten, die von einer Art in einem Regionsjahr besetzt sind
  • Die Zeit ist eine kontinuierliche Variable, die die Zeit bis zum Aussterben oder zur Besiedlung angibt. es ist immer positiv
  • Typ ist eine kategoriale Variable mit zwei Ebenen. Diese beiden Ebenen sind "-" und "+". Bei Typ - handelt es sich um eine Kolonisierung (Standardstufe). Wenn type + ist, ist es ein Erlöschen.
  • Reg ist eine kategoriale Variable mit neun Ebenen, die die Region angibt
  • Spp ist eine kategoriale Variable; Die Anzahl der Ebenen variiert zwischen den Regionen und zwischen 48 und 144 Ebenen.

In Worten: Die Antwortvariable ist die Prävalenz (Anteil der besetzten Schichten). Behobene Effekte umfassten 1) und Intercept, 2) Zeit vom Ereignis und 3) die Interaktion zwischen Zeit bis zum Ereignis und der Art des Ereignisses (Kolonisierung oder Auslöschung). Jeder dieser drei Effekte variierte zufällig zwischen den Regionen. Innerhalb einer Region variierte jeder der Effekte zufällig zwischen den Arten.

Ich versuche herauszufinden, wie man die mathematische Gleichung für das Modell schreibt. Ich denke, ich verstehe, was im R-Code vor sich geht (obwohl ich sicher bin, dass ich einige Wissenslücken habe, und hoffentlich wird das Ausschreiben des formalen mathematischen Ausdrucks mein Verständnis verbessern).

Ich habe im Internet und in diesen Foren ziemlich viel gesucht. Ich habe sicher Unmengen nützlicher Informationen gefunden (und vielleicht werde ich in einer Bearbeitung zu dieser Frage auf einige davon verweisen). Allerdings konnte ich nicht ganz feststellen, dass "Rosetta Stone" von R-Code in Mathe übersetzt wurde (ich bin mit Code besser vertraut), was mir wirklich helfen würde, zu bestätigen, dass ich diese Gleichungen richtig verstanden habe. Ich weiß, dass es bereits einige Lücken gibt, aber wir werden darauf zurückkommen.


Mein Versuch

Die Grundform eines Mixed-Effects-Modells in Matrixnotation lautet (nach meinem Verständnis):

Y=Xβ+Zγ+ϵ

β

X=[1ΔtΔt+1ΔtnΔt+,n]
Z= [ 1 I ( r 1 ) Δ t I ( r 1 ) Δ t + I ( r 1 ) 1 I ( r 9 ) Δ t I ( r 9 ) Δ t + I ( r 9 )
β=[β0β1β2]
γ
Z=[1I(r1)ΔtI(r1)Δt+I(r1)1I(r9)ΔtI(r9)Δt+I(r9)1I(r1,n)ΔtnI(r1,n)Δt+,nI(r1,n)1I(r9,n)ΔtI(r9,n)Δt+,nI(r9,n)]
γ=[γ0,1γ1,1γ2,1γ0,9γ1,9γ2,9]
ϵN(0,Σ)
  • X ist die Entwurfsmatrix für die festen Effekte, ist die Zeit nach der Besiedlung ( ) und ist die Zeit nach dem Aussterben ( )ΔttimeΔt+time:type
  • Z ist die Entwurfsmatrix für die Zufallseffekte (Ebene 1?), I () ist die Indikatorfunktion, die 1 ergibt, wenn die Stichprobe zur angegebenen Region gehört, und 0, andernfalls wird r indiziert, um eine der neun Regionen anzuzeigen.
  • β und enthalten Parameterγ
  • ϵ ist fehlerhaft; Ich bin nicht ganz sicher, wie ich erklären soll , obwohl ich weiß, dass eine dieser Varianz / Kovarianz-Matrizen Kovarianzen zwischen Steigungen und Abschnitten ausdrückt, zΣ

Vorausgesetzt, die Dinge sind ~ korrekt, bedeutet das, dass ich auf der obersten Ebene gut bin. Das Erklären der artspezifischen Variation der Parameter, die in jeder Region verschachtelt ist, hat mich jedoch noch mehr überrascht.

Aber ich habe etwas geknackt, das vielleicht Sinn macht ...

Jeder der Parameter in leitet sich aus einer linearen Kombination speziesspezifischer Prädiktoren und Parameter innerhalb einer Region ab. Für jede Region gibt es 3 Zeilen, die den 3 Prädiktorvariablen entsprechen. Jedes kann einzeln ausgedrückt werden alsγγ

  • γp,r=Up,rbp,r+ηp,r
    • wobei eine für die Region spezifische Entwurfsmatrix und Prädiktor , eine 1 × S-Matrix von Parametern für die Region ist (Reichtum in der Region = , z. B. 48 oder 144), und ist eine Matrix von FehlertermenUp,rrpbp,rSηp,r

Speziell für eine gegebene Region wäre jede der :γp,r

γ0,r=U0,rb0,r+η0,r
γ0,r=[1ich(s1)1ich(sS)]+[b0,1b0,S]+η0,r
γ1,r=U1,rb1,r+η1,r
γ1,r=[Δtich(s1)Δtich(sS)]+[b1,1b1,S]+η1,r
γ2,r=U2,rb2,r+η2,r
γ2,r=[Δt+ich(s1)Δt+ich(sS)]+[b2,1b2,S]+η2,r

Das würde sich für jede Region wiederholen. Dann wie . Obwohl es vielleicht anstelle von anderen Buchstaben wie gibt, der häufig verwendet wird.ηN(0,Ση)ϵΣG


Edit: andere Q / A's, die etwas hilfreich waren

rbatt
quelle
Ich bezweifle, dass dieses Papier die "Antwort" auf Ihre Frage hat, aber es hat mir als Grundstein für HMM-Modellgleichungen gedient. Vergessen Sie, dass es in SAS verwurzelt ist, es ist nur ein hervorragender Überblick über diese Klasse von Modellen. Judith Singer, Verwendung von SAS Proc, gemischt zur Anpassung von Mehrebenenmodellen, hierarchischen Modellen und individuellen Wachstumsmodellen, JEBS , Winter 1998, vol. 24, Nr. 4, S. 323-355.
Mike Hunter
1
Haben Sie hier Abschnitt 2.3 gelesen ?
Robert Long
Ich habe sie gelesen und Ressourcen wie diese haben mich so weit gebracht. Es könnte sein, dass ich es einfach weiter versuchen muss, aber ich konnte kein Beispiel finden, das kompliziert genug war, um mir ein ausreichendes Vertrauen in meinen aktuellen Ansatz zu geben.
rbatt
Nach meinem Verständnis ist "Verschachteln" nur eine Interaktion in früheren Modellen. Dieser Begriff wird durch die Verwendung der gleichen Syntax verstärkt. Ich glaube also, dass reg: spp von einer einzelnen kategorialen Variablen und nur einer weiteren Gruppe von Blöcken in Z behandelt werden kann.
deasmhumnha
Ich würde auch davon ausgehen, dass lmer eine perfekte Kolinearität vermeidet und nur die nicht redundanten Wechselwirkungen in die zusätzliche Variable einbezieht.
Deasmhumnha

Antworten:

1

Wenn ich den Code richtig verstanden habe, warum nicht einfach so etwas schreiben?

yich=(α+νj[ich](α)+ηk[ich](α))+(β+νj[ich](β)+ηk[ich](β))Tich+(δ+νj[ich](δ)+ηk[ich](δ))(TichZich)+ϵich
mit oder, Wenn die erste Gleichung zu lang ist, ist etwas wie und
[νj(α),νj(β),νj(δ)]Multi-Normal(0,Σν)[ηj(α),ηj(β),ηj(δ)]Multi-Normal(0,Ση)ϵichNormal(0,σϵ)
yich=αj[ich],k[ich]+βj[ich],k[ich]Tich+δj[ich],k[ich](TichZich)+ϵich
αj[ich],k[ich]=α+νj(α)+ηk(α)βj[ich],k[ich]=β+νj(β)+ηk(β)δj[ich],k[ich]=δ+νj(δ)+ηk(δ)
mit derselben Kovarianzstruktur wie oben? Es zeigt die verschachtelte Struktur der Daten sowie welche Koeffizienten über welche Ebenen variieren.

baruuum
quelle