Spezifiziere ich mein früheres Modell richtig?

9

Ich habe Google und diese Website durchsucht und bin immer noch verwirrt über die lmer-Funktion in der lme4-Bibliothek.

Ich habe einige Daten von verschiedenen psychiatrischen Stationen gesammelt, die eine mehrstufige Struktur haben. Zur Vereinfachung werde ich zwei Variablen der Ebene 2 und zwei Variablen der Ebene 1 auswählen, obwohl ich tatsächlich ein paar mehr habe.

Level 2 - WardSize [dies ist die Anzahl der Personen auf der Station] & WAS [dies ist ein Maß dafür, wie "nett" die Station ist]

Die Gruppierungsvariable, die R mitteilt, wer in welcher Station ist, heißt "Station".

Stufe eins - Geschlecht [dies ist offensichtlich Geschlecht] & BSITotal [dies ist ein Maß für die Schwere der Symptome]

Das Ergebnis ist Selfreject, wie es sich anhört.

Ich habe diese Formel:

help = lmer (Formel = Selfreject ~ WardSize + WAS + Geschlecht + BSITotal + (1 | Ward))

Ich hoffe, dies bedeutet, dass "jede Person eine Punktzahl hat, die sich auf ihr eigenes Geschlecht und ihre Schwere der Symptome bezieht, und auch einen Effekt auf Stationsebene, der sich auf die Größe der Station bezieht und wie" schön "sie ist."

Ist das richtig? Das, was mich verwirrt, ist, dass ich nicht sehen kann, wie R erkennen kann, welche Variablen der Ebene 1 und welche der Ebene 2 sind, mit Ausnahme des am Ende angegebenen Abschnitts auf Stationsebene.

Wenn jemand die Notation erklären könnte, damit ein Idiot wie ich verstehen kann, wäre das noch besser.

Danke vielmals!

Chris Beeley
quelle

Antworten:

11

Ihre Modellspezifikation ist in Ordnung.

Der unterschiedliche Abschnitt für Ward, der in lmer angegeben ist, wie Sie es mit (1 | Ward) getan haben, besagt, dass die Themen in jeder Station bei Selfreject aus anderen Gründen als WardSize oder Gender möglicherweise ähnlicher sind, also kontrollieren Sie Heterogenität zwischen den Stationen.

Sie können sich die "1" als eine Spalte von 1s (dh eine Konstante) in den Daten vorstellen, an die ein Achsenabschnitt angepasst ist. Normalerweise wird die "1" beispielsweise in lm automatisch impliziert

lm(Y ~ X1 + X2)

tatsächlich spezifiziert

lm(Y ~ 1 + X1 + X2)

Nachdem Sie Ihr Grundmodell haben, können Sie weitere Fragen stellen wie "Unterscheidet sich die Beziehung zwischen BSItotal und Selfreject zwischen den Stationen?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Das heißt, sowohl der Achsenabschnitt als auch die Steigung von BSITotal können sich zwischen den Stationen unterscheiden.

Wenn Sie es noch nicht aufgegriffen haben, ist Gelman & Hills Datenanalyse mit Regression und Mehrebenenmodell / Hierarchischen Modellen ein großartiges Buch, in dem die Anpassung solcher Modelle mit lmer erläutert wird.

M Adams
quelle
1

Hier ist ein Link zu einer Erklärung von Douglas Bates (der lme4 geschrieben hat), warum es nicht notwendig ist, die Stufe für feste Effekte anzugeben.

Breyer
quelle
2
Willkommen auf der Website, @Breyer. Ich vermute, dass dies ein hilfreicher Beitrag ist. Würde es Ihnen etwas ausmachen, dort eine kurze Zusammenfassung des Arguments zu geben, damit die Leser entscheiden können, ob es das ist, wonach sie suchen, oder im Falle eines zukünftigen Linkrot?
Gung - Reinstate Monica
2
Danke für die Begrüßung @gung. Sicher, Bates erklärt, dass es nicht notwendig ist, Ebenen für feste Effekte anzugeben, da das lme4-Paket für gemischte Modelle geschrieben wurde, einschließlich, aber nicht beschränkt auf mehrstufige / hierarchische Modelle. Dies bedeutet, dass die Berechnungsmethoden nicht auf der Angabe von Ebenen beruhen, wie dies bei einer speziellen mehrstufigen Regressionssoftware (HLM usw.) der Fall ist, die die verschachtelte Datenstruktur bei der Berechnung nutzt.
Breyer