Fragen zur Angabe linearer gemischter Modelle in R für Daten mit wiederholten Messungen mit zusätzlicher Verschachtelungsstruktur

Datenstruktur

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

Vollständiger Modellkandidat

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)

Die Reaktionszeiten aus Studien werden in Sitzungen zusammengefasst, die wiederum in Patienten zusammengefasst werden
Jeder Versuch kann durch zwei kontinuierliche Kovariaten von ASCORE und HSCORE (zwischen 1 und 9) und durch eine Bewegungsreaktion (Rückzug oder Annäherung) charakterisiert werden.
Sitzungen sind gekennzeichnet durch Drogenkonsum (Placebo oder aktives Pharmakon) und durch Fülle (gefastet oder vor der Fütterung)

Modellierung und R-Syntax?

Ich versuche, ein geeignetes vollständiges Modell mit einer geladenen Mittelwertstruktur anzugeben , das als Ausgangspunkt für eine Top-Down-Modellauswahlstrategie verwendet werden kann.

Spezifische Fragen:

Gibt die Syntax die Cluster- und Zufallseffekte korrekt an?
Ist dieses Modell über die Syntax hinaus für das oben genannte subjektinterne Design geeignet?
Sollte das vollständige Modell alle Wechselwirkungen fester Effekte angeben oder nur diejenigen, die mich wirklich interessieren?
Ich habe den STIM-Faktor nicht in das Modell aufgenommen, der den in einer Studie verwendeten spezifischen Stimulustyp charakterisiert, den ich aber in keiner Weise schätzen möchte - sollte ich angeben, dass er als Zufallsfaktor 123 Niveaus und sehr wenige aufweist Datenpunkte pro Stimulustyp?

r mixed-model repeated-measures model-selection lme4-nlme Cel
quelle

Wenn ich hier keinen Rat finde, weiß ich wirklich nicht, wen ich fragen könnte? Vielleicht kennen Sie spezielle Foren für gemischte Modelle oder sogar einen Experten, der bereit ist, sich für ein wenig Geld zu beraten?

Cel

Hallo @Cel, es sieht so aus, als hätten Sie ALLE Interaktionen im Modell, einschließlich der 5-Wege-, 4-Wege- und 3-Wege-Interaktionen. Ich bin mir in diesem Fall nicht sicher, aber das passt normalerweise stark zu den Daten, wodurch Ihre Ergebnisse weniger verallgemeinerbar werden. Die Rückwärtsauswahl (wenn Sie sie verwenden müssen) muss nicht mit einem vollständig gesättigten Modell beginnen - sie sollte mit dem größten Modell beginnen, das Sie für plausibel halten. Können Sie das überhaupt reduzieren?

Makro

@ Macro toll zu wissen, ich werde nur die Interaktionen einbeziehen, die dann plausibel erscheinen. Haben Sie Vorschläge zu anderen Themen? Wenn Sie dies tun, geben Sie es vielleicht als Antwort an, damit ich es akzeptieren kann.

Cel

Ich werde jede Ihrer Fragen der Reihe nach beantworten.

Gibt die Syntax die Cluster- und Zufallseffekte korrekt an?

Das Modell, das Sie hier angepasst haben, ist mathematisch gesehen das Modell

Y_{i j k} = X_{i j k} β + η_{i} + θ_{i j} + ε_{i j k}

$Y_{ijk} = {\bf X}_{ijk} {\boldsymbol \beta} + \eta_{i} + \theta_{ij} + \varepsilon_{ijk}$

$Y_{ijk}$ ist die Reaktionszeit für die Beobachtung während der Sitzung an Person . $k$ $j$ $i$
${\bf X}_{ijk}$ ist der Prädiktorvektor für die Beobachtung während der Sitzung auf Individuum (in dem Modell, das Sie geschrieben haben, umfasst dies alle Haupteffekte und alle Interaktionen). $k$ $j$ $i$
$\eta_i$ ist die Person Zufallseffekt , dass induziert Korrelation zwischen auf der gleichen Person gemachten Beobachtungen. ist der zufällige Effekt für die Sitzung einzelnen und ist der verbleibende Fehlerbegriff. $i$ $\theta_{ij}$ $i$ $j$ $\varepsilon_{ijk}$
${\boldsymbol \beta}$ ist der Regressionskoeffizientenvektor.

Wie auf Seite 14-15 hier angegeben, ist dieses Modell korrekt, um anzugeben, dass Sitzungen in Einzelpersonen verschachtelt sind, wie aus Ihrer Beschreibung hervorgeht.

Ist dieses Modell über die Syntax hinaus für das oben genannte subjektinterne Design geeignet?

Ich denke, dieses Modell ist vernünftig, da es die Verschachtelungsstruktur in den Daten respektiert, und ich denke, dass Individuum und Sitzung vernünftigerweise als zufällige Effekte betrachtet werden, wie dieses Modell behauptet. Sie sollten die Beziehungen zwischen den Prädiktoren und der Antwort mit Streudiagrammen usw. untersuchen, um sicherzustellen, dass der lineare Prädiktor ( ) korrekt angegeben ist. Möglicherweise sollte auch die andere Standard-Regressionsdiagnostik untersucht werden. ${\bf X}_{ijk} {\boldsymbol \beta}$

Sollte das vollständige Modell alle Wechselwirkungen fester Effekte angeben oder nur diejenigen, die mich wirklich interessieren?

Ich denke, mit einem so stark gesättigten Modell zu beginnen, ist vielleicht keine gute Idee, es sei denn, es ist inhaltlich sinnvoll. Wie ich in einem Kommentar sagte, wird dies dazu neigen, Ihren speziellen Datensatz zu überfordern und Ihre Ergebnisse möglicherweise weniger verallgemeinerbar zu machen. Wenn Sie in Bezug auf die Modellauswahl mit dem vollständig gesättigten Modell beginnen und eine Rückwärtsauswahl treffen (gegen die einige Personen auf dieser Site aus gutem Grund Einwände erheben ), müssen Sie sicherstellen, dass die Hierarchie im Modell eingehalten wird. Wenn Sie also eine Interaktion auf niedrigerer Ebene aus dem Modell entfernen, sollten Sie auch alle Interaktionen auf höherer Ebene löschen, an denen diese Variable beteiligt ist. Weitere Informationen hierzu finden Sie im verknüpften Thread.

Ich habe den STIM-Faktor nicht in das Modell aufgenommen, der den in einer Studie verwendeten spezifischen Stimulustyp charakterisiert, den ich aber in keiner Weise schätzen möchte - sollte ich angeben, dass er als Zufallsfaktor 123 Niveaus und sehr wenige aufweist Datenpunkte pro Stimulustyp?

Zugegeben, Sie wissen nichts über die Anwendung (nehmen Sie dies also mit einem Körnchen Salz), das klingt nach einem festen Effekt, nicht nach einem zufälligen Effekt. Das heißt, der Behandlungstyp klingt wie eine Variable, die einer festen Verschiebung der mittleren Reaktion entspricht, und nicht wie eine Korrelation zwischen Probanden, die denselben Reiztyp hatten. Die Tatsache, dass es sich um einen 123-Level-Faktor handelt, macht es jedoch umständlich, in das Modell einzusteigen. Ich würde wahrscheinlich gerne wissen, wie groß der Effekt sein würde, den Sie erwarten würden. Unabhängig von der Größe des Effekts führt dies nicht zu einer Verzerrung Ihrer Steigungsschätzungen, da es sich um ein lineares Modell handelt. Wenn Sie es jedoch weglassen, werden Ihre Standardfehler möglicherweise größer als sonst.

Makro
quelle

Beeindruckend. Danke Macro, ich wünschte ich könnte mehr Punkte geben.

Cel

die Notation und (statt ) sein, da die zufälligen Effekte eher gekreuzt als zufällig sind , da sie mit dem Patienten gekreuzt (und nicht verschachtelt) sind?

η_{i}

$\eta_{i}$

θ_{j}

$\theta_{j}$

θ_{j}

$\theta_{j}$

Joshua Rosenberg

Fragen zur Angabe linearer gemischter Modelle in R für Daten mit wiederholten Messungen mit zusätzlicher Verschachtelungsstruktur

Datenstruktur

Vollständiger Modellkandidat

Modellierung und R-Syntax?

Antworten: