Datenstruktur
> str(data)
'data.frame': 6138 obs. of 10 variables:
$ RT : int 484 391 422 516 563 531 406 500 516 578 ...
$ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
$ HSCORE : num 6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
$ MVMNT : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
$ STIM : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
$ DRUG : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
$ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
$ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
$ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
$ TRIAL : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...
Vollständiger Modellkandidat
model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
+ (1|PATIENT) + (1|SESSION), data, REML = TRUE)
- Die Reaktionszeiten aus Studien werden in Sitzungen zusammengefasst, die wiederum in Patienten zusammengefasst werden
- Jeder Versuch kann durch zwei kontinuierliche Kovariaten von ASCORE und HSCORE (zwischen 1 und 9) und durch eine Bewegungsreaktion (Rückzug oder Annäherung) charakterisiert werden.
- Sitzungen sind gekennzeichnet durch Drogenkonsum (Placebo oder aktives Pharmakon) und durch Fülle (gefastet oder vor der Fütterung)
Modellierung und R-Syntax?
Ich versuche, ein geeignetes vollständiges Modell mit einer geladenen Mittelwertstruktur anzugeben , das als Ausgangspunkt für eine Top-Down-Modellauswahlstrategie verwendet werden kann.
Spezifische Fragen:
- Gibt die Syntax die Cluster- und Zufallseffekte korrekt an?
- Ist dieses Modell über die Syntax hinaus für das oben genannte subjektinterne Design geeignet?
- Sollte das vollständige Modell alle Wechselwirkungen fester Effekte angeben oder nur diejenigen, die mich wirklich interessieren?
- Ich habe den STIM-Faktor nicht in das Modell aufgenommen, der den in einer Studie verwendeten spezifischen Stimulustyp charakterisiert, den ich aber in keiner Weise schätzen möchte - sollte ich angeben, dass er als Zufallsfaktor 123 Niveaus und sehr wenige aufweist Datenpunkte pro Stimulustyp?
Antworten:
Ich werde jede Ihrer Fragen der Reihe nach beantworten.
Gibt die Syntax die Cluster- und Zufallseffekte korrekt an?
Das Modell, das Sie hier angepasst haben, ist mathematisch gesehen das Modell
wo
Wie auf Seite 14-15 hier angegeben, ist dieses Modell korrekt, um anzugeben, dass Sitzungen in Einzelpersonen verschachtelt sind, wie aus Ihrer Beschreibung hervorgeht.
Ist dieses Modell über die Syntax hinaus für das oben genannte subjektinterne Design geeignet?
Ich denke, dieses Modell ist vernünftig, da es die Verschachtelungsstruktur in den Daten respektiert, und ich denke, dass Individuum und Sitzung vernünftigerweise als zufällige Effekte betrachtet werden, wie dieses Modell behauptet. Sie sollten die Beziehungen zwischen den Prädiktoren und der Antwort mit Streudiagrammen usw. untersuchen, um sicherzustellen, dass der lineare Prädiktor ( ) korrekt angegeben ist. Möglicherweise sollte auch die andere Standard-Regressionsdiagnostik untersucht werden.Xijkβ
Sollte das vollständige Modell alle Wechselwirkungen fester Effekte angeben oder nur diejenigen, die mich wirklich interessieren?
Ich denke, mit einem so stark gesättigten Modell zu beginnen, ist vielleicht keine gute Idee, es sei denn, es ist inhaltlich sinnvoll. Wie ich in einem Kommentar sagte, wird dies dazu neigen, Ihren speziellen Datensatz zu überfordern und Ihre Ergebnisse möglicherweise weniger verallgemeinerbar zu machen. Wenn Sie in Bezug auf die Modellauswahl mit dem vollständig gesättigten Modell beginnen und eine Rückwärtsauswahl treffen (gegen die einige Personen auf dieser Site aus gutem Grund Einwände erheben ), müssen Sie sicherstellen, dass die Hierarchie im Modell eingehalten wird. Wenn Sie also eine Interaktion auf niedrigerer Ebene aus dem Modell entfernen, sollten Sie auch alle Interaktionen auf höherer Ebene löschen, an denen diese Variable beteiligt ist. Weitere Informationen hierzu finden Sie im verknüpften Thread.
Ich habe den STIM-Faktor nicht in das Modell aufgenommen, der den in einer Studie verwendeten spezifischen Stimulustyp charakterisiert, den ich aber in keiner Weise schätzen möchte - sollte ich angeben, dass er als Zufallsfaktor 123 Niveaus und sehr wenige aufweist Datenpunkte pro Stimulustyp?
Zugegeben, Sie wissen nichts über die Anwendung (nehmen Sie dies also mit einem Körnchen Salz), das klingt nach einem festen Effekt, nicht nach einem zufälligen Effekt. Das heißt, der Behandlungstyp klingt wie eine Variable, die einer festen Verschiebung der mittleren Reaktion entspricht, und nicht wie eine Korrelation zwischen Probanden, die denselben Reiztyp hatten. Die Tatsache, dass es sich um einen 123-Level-Faktor handelt, macht es jedoch umständlich, in das Modell einzusteigen. Ich würde wahrscheinlich gerne wissen, wie groß der Effekt sein würde, den Sie erwarten würden. Unabhängig von der Größe des Effekts führt dies nicht zu einer Verzerrung Ihrer Steigungsschätzungen, da es sich um ein lineares Modell handelt. Wenn Sie es jedoch weglassen, werden Ihre Standardfehler möglicherweise größer als sonst.
quelle