Die Formel, die man für das Training eines Mehrebenenmodells ( lmer
aus der lme4
R
Bibliothek) angeben muss, bringt mich immer weiter. Ich habe unzählige Lehrbücher und Tutorials gelesen, aber nie richtig verstanden.
Hier ist ein Beispiel aus diesem Tutorial , das ich gerne in einer Gleichung formuliert sehen würde. Wir versuchen, die Sprachfrequenz in verschiedenen Szenarien als Funktion des Geschlechts (Frauen haben eine höhere Stimme als Männer im Allgemeinen) und der Einstellung der Person (ob sie höflich oder informell geantwortet hat) zu modellieren. Wie Sie der subject
Spalte entnehmen können, wurde jede Person mehrmals gemessen.
> head(politeness, n=20)
subject gender scenario attitude frequency
1 F1 F 1 pol 213.3
2 F1 F 1 inf 204.5
3 F1 F 2 pol 285.1
4 F1 F 2 inf 259.7
5 F1 F 3 pol 203.9
6 F1 F 3 inf 286.9
7 F1 F 4 pol 250.8
8 F1 F 4 inf 276.8
9 F1 F 5 pol 231.9
10 F1 F 5 inf 252.4
11 F1 F 6 pol 181.2
12 F1 F 6 inf 230.7
13 F1 F 7 inf 216.5
14 F1 F 7 pol 154.8
15 F3 F 1 pol 229.7
16 F3 F 1 inf 237.3
17 F3 F 2 pol 236.8
18 F3 F 2 inf 251.0
19 F3 F 3 pol 267.0
20 F3 F 3 inf 266.0
subject
, gender
Und attitude
sind Faktoren (mit informal
und female
als Basisebene betrachteten für attitude
und gender
in den Gleichungen unten). Eine Idee ist nun, ein Modell mit unterschiedlichen Abschnitten für jedes zu trainieren subject
und scenario
:
politeness.model=lmer(frequency ~ attitude + gender +
(1|subject) + (1|scenario), data=politeness)
Wenn mein Verständnis der Notation korrekt ist, entspricht dies:
attitude
gender
wo bezeichnet Datenpunkt, Bezeichnet Gruppenebene für und Bezeichnet Gruppenebene für für Datenpunkt. und sind binäre Indikatoren.subject
scenario
attitude
gender
Um zufällige Steigungen für die Einstellung einzuführen, können wir schreiben:
politeness.model = lmer(frequency ~ attitude + gender +
(1+attitude|subject) + (1+attitude|scenario), data=politeness)
Wenn mein Verständnis klar ist, entspricht dies wiederum:
attitude
gender
Welcher Gleichung entspricht nun der folgende R
Befehl?
politeness.null = lmer(frequency ~ gender +
(1+attitude|subject) + (1+attitude|scenario), data=politeness)
quelle
attitude
noch konditioniert aufsubject
undscenario
.Antworten:
ich würde schreiben
wie
fügt Variationen zwischen den Subjekten als Reaktion auf
attitude
und hinzuscenario
(wir könnten den Teil mit zufälligen Effekten äquivalent schreiben als(attitude|subject) + (attitude|scenario)
, dh den Abschnitt implizit lassen; dies ist Geschmackssache). JetztEs kann lehrreich sein, Begriffe wie folgt zu gruppieren: So können Sie sehen, welche zufälligen Effekte den Achsenabschnitt beeinflussen und welche die Reaktion auf die Einstellung beeinflussen.
Wenn Sie nun denβ1=0
attitude
Term mit festem Effekt weglassen (dh oder den Term aus der Formel streichen), können Sie sehen (ohne alles neu zu schreiben), dass wir es sein werden, da angenommen wird, dass die zufälligen Effekte den Mittelwert Null haben Unter der Annahme, dass die durchschnittliche Reaktion auf die Einstellung zwischen Themen und Szenarien genau Null ist, gibt es immer noch Unterschiede zwischen Themen und Szenarien. Ich werde nicht sagen, dass dies aus statistischer Sicht niemals Sinn macht, aber es tut es selten. Es gibt Diskussionen zu diesem Thema auf der Mailingliste [email protected] von Zeit zu Zeit ... (oder es kann irgendwo auf StackExchange besprochen werden - wenn nicht, wäre es eine gute Folge -up SE Frage ...)attitude
quelle