Ich habe diese Übersicht der lm / lmer R-Formeln von @conjugateprior durchgesehen und bin durch den folgenden Eintrag verwirrt:
Angenommen, A ist zufällig, aber B ist fest und B ist in A verschachtelt.
aov(Y ~ B + Error(A/B), data=d)
Im Folgenden wird eine analoge Mischmodellformel lmer(Y ~ B + (1 | A:B), data=d)
für denselben Fall angegeben.
Ich verstehe nicht ganz, was es bedeutet. In einem Experiment, bei dem die Probanden in mehrere Gruppen unterteilt sind, wird ein Zufallsfaktor (Probanden) in einen festen Faktor (Gruppen) eingebettet. Aber wie kann ein fester Faktor in einem Zufallsfaktor verschachtelt werden? Etwas Festes in zufälligen Themen verschachtelt? Ist es überhaupt möglich? Wenn es nicht möglich ist, machen diese R-Formeln Sinn?
Es wird erwähnt, dass diese Übersicht teilweise auf den Seiten des Persönlichkeitsprojekts zur Durchführung von ANOVA in R basiert, die sich auf dieses Tutorial zu wiederholten Maßnahmen in R stützen . Dort ist das folgende Beispiel für die wiederholten Maßnahmen ANOVA gegeben:
aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)
Hier werden Probanden mit Wörtern unterschiedlicher Wertigkeit (Faktor mit drei Stufen) vorgestellt und ihre Erinnerungszeit gemessen. Jedes Thema wird mit Wörtern aller drei Valenzstufen dargestellt. Ich sehe in diesem Design nichts Verschachteltes (es scheint laut der großartigen Antwort hier gekreuzt zu sein ), und daher würde ich naiv denken, dass Error(Subject)
oder (1 | Subject)
sollte in diesem Fall ein passender zufälliger Begriff sein. Die Subject/Valence
"Verschachtelung" (?) Ist verwirrend.
Beachten Sie, dass ich verstehe, dass dies Valence
ein Faktor innerhalb des Subjekts ist. Aber ich denke, es ist kein "verschachtelter" Faktor innerhalb von Fächern (weil alle Fächer alle drei Stufen von erfahren Valence
).
Aktualisieren. Ich untersuche Fragen zum Lebenslauf zur Kodierung von ANOVA mit wiederholten Messungen in R.
Hier wird Folgendes für feste subjektinterne / wiederholte Maßnahmen A und zufällig verwendet
subject
:summary(aov(Y ~ A + Error(subject/A), data = d)) anova(lme(Y ~ A, random = ~1|subject, data = d))
Hier für zwei fixe subjektinterne / wiederholte Effekte A und B:
summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d)
Hier für drei subjektinterne Effekte A, B und C:
summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d)) lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)
Meine Fragen:
- Warum
Error(subject/A)
nichtError(subject)
? - Ist es
(1|subject)
oder(1|subject)+(1|A:subject)
oder einfach(1|A:subject)
? - Ist es
(1|subject) + (1|A:subject)
oder(1|subject) + (0+A|subject)
und warum nicht einfach(A|subject)
?
Inzwischen habe ich einige Threads gesehen, die behaupten, dass einige dieser Dinge gleichwertig sind (z. B. die erste: eine Behauptung, dass sie gleich sind, aber eine entgegengesetzte Behauptung auf SO ; die dritte: eine Art Behauptung, dass sie gleich sind ). Sind sie?
quelle
subject/condition
, ist dies konzeptionell zweifelhaft, da es darauf hinzudeuten scheint, dass die Bedingungen in Subjekten verschachtelt sind, wenn eindeutig das Gegenteil der Fall ist, aber das Modell, das tatsächlich passtsubject + subject:condition
, ein perfekt gültiges Modell mit zufälligen Subjekteffekten ist und zufällige Steigungen des Subjekts X.lm
undaov
Formeln? Wenn ich eine maßgebliche Quelle haben möchte, für was genauaov
(ist es ein Wrapperlm
?) Und wie dieError()
Begriffe funktionieren, wo soll ich suchen?aov
ist ein Wrapper fürlm
in dem Sinne, dasslm
es für die kleinsten Quadrate passt,aov
erledigt aber einige zusätzliche Arbeiten (insbesondere die Übersetzung desError
Begriffs fürlm
). Die maßgebliche Quelle ist der Quellcode oder möglicherweise der Verweis inhelp("aov")
: Chambers et al. (1992). Aber ich habe keinen Zugriff auf diese Referenz, also würde ich den Quellcode untersuchen.Antworten:
In gemischten Modellen kann die Behandlung von Faktoren als fest oder zufällig, insbesondere in Verbindung mit der Frage, ob sie gekreuzt, teilweise gekreuzt oder verschachtelt sind, zu viel Verwirrung führen. Außerdem scheint es terminologische Unterschiede zwischen der Verschachtelung in der Welt der anova / designed-Experimente und der Welt der mixed / multilevel-Modelle zu geben.
Ich gebe nicht zu, alle Antworten zu kennen, und meine Antwort wird nicht vollständig sein (und möglicherweise weitere Fragen ergeben), aber ich werde versuchen, einige der Probleme hier anzusprechen:
(der Fragentitel)
Nein, ich glaube nicht, dass das Sinn macht. Wenn wir es mit wiederholten Takten zu tun haben, dann ist normalerweise alles, worauf sich die Takte wiederholen, zufällig. Nennen wir es einfach
Subject
, undlme4
wir wollenSubject
auf der rechten Seite einen oder mehrere|
in den zufälligen Teil des einschließen Formel. Wenn wir andere zufällige Effekte haben, dann sind diese entweder gekreuzt, teilweise gekreuzt oder verschachtelt - und meine Antwort auf diese Frage spricht das an.Das Problem bei diesen Experimenten vom Anova-Typ scheint zu sein, wie mit Faktoren umgegangen werden soll, die normalerweise in einer Situation mit wiederholten Messungen als behoben angesehen werden, und die Fragen im Gremium des OP sprechen dafür:
Ich benutze normalerweise nicht,
aov()
damit mir etwas fehlen könnte, aber für michError(subject/A)
ist das im Falle der verlinkten Frage sehr irreführend .Error(subject)
in der Tat führt zu genau den gleichen Ergebnissen.Dies bezieht sich auf diese Frage. In diesem Fall führen alle folgenden Zufallseffektformulierungen zu genau demselben Ergebnis:
Dies liegt jedoch daran, dass das simulierte Dataset in der Frage innerhalb von nichts variiert. Es wird nur mit erstellt
Y = rnorm(48)
. Wenn wir einen realen Datensatz wie dencake
in nehmenlme4
, stellen wir fest, dass dies im Allgemeinen nicht der Fall ist. In der Dokumentation finden Sie den Versuchsaufbau:Wir haben also wiederholte Maßnahmen in
replicate
uns, und wir interessieren uns auch für die festen Faktorenrecipe
undtemperature
(die wir ignorieren können,temp
da dies nur eine andere Kodierung isttemperature
), und wir können die Situation visualisieren, indem wir Folgendes verwendenxtabs
:Wenn
recipe
es sich um einen zufälligen Effekt handeln würde, würden wir sagen, dass es sich um gekreuzte zufällige Effekte handelt. In keiner Weiserecipe A
gehörtreplicate 1
oder irgendein anderes Replikat.Ähnliches gilt für
temp
.Das erste Modell, zu dem wir passen könnten, ist:
Dies wird jede
replicate
als einzige Quelle für zufällige Variationen behandeln (abgesehen vom Rest natürlich). Es kann jedoch zu zufälligen Unterschieden zwischen den Rezepten kommen. Wir könnten also versucht sein, einenrecipe
anderen (gekreuzten) Zufallseffekt einzubeziehen, aber das wäre nicht ratsam, da wir nur drei Stufenrecipe
haben und wir nicht erwarten können, dass das Modell die Varianzkomponenten gut einschätzt. Stattdessen können wir alsoreplicate:recipe
als Gruppierungsvariable verwenden, mit der wir jede Kombination aus Replikat und Rezept als separaten Gruppierungsfaktor behandeln können. Während wir mit dem obigen Modell 15 zufällige Abschnitte für die Ebenen von haben, habenreplicate
wir jetzt 45 zufällige Abschnitte für jede der separaten Kombinationen:Beachten Sie, dass wir jetzt (sehr geringfügig) unterschiedliche Ergebnisse haben, die darauf hinweisen, dass es aufgrund des Rezepts eine zufällige Variabilität gibt, aber nicht sehr viele.
Wir könnten das auch so machen
temperature
.Zurück zu Ihrer Frage, fragen Sie auch
Ich bin mir nicht ganz sicher, woher dies kommt (unter Verwendung von zufälligen Steigungen) - es scheint nicht in den 2 verknüpften Fragen aufzutreten -, aber mein Problem
(1|subject) + (1|A:subject)
ist, dass dies genau das gleiche ist,(1|subject/A)
was bedeutet, dassA
es sich in verschachteltsubject
, was in turn bedeutet (für mich), dass jede Ebene vonA
in 1 vorkommt und nur 1 Ebene vonsubject
der hier eindeutig nicht der Fall ist.Ich werde diese Antwort wahrscheinlich ergänzen und / oder bearbeiten, nachdem ich mir weitere Gedanken gemacht habe, aber ich wollte meine ersten Gedanken festhalten.
quelle
cake
Datensatz verstehe . Es scheint, dass die Replikation im Rezept verschachtelt ist. Der Grundxtabs
zeigt nicht, dass dies genau der Grund ist, den Sie in Ihrer Antwort "Verschachtelt gegen gekreuzt" beschrieben haben: Die Replikation ist verwirrenderweise mit 1-15 und nicht mit 1-45 codiert. Für jedes Rezept wurden 15 "Wiederholungen" mit 6 Kuchen durchgeführt; Jeder Kuchen wurde dann bei unterschiedlicher Temperatur gebacken. Das Rezept ist also ein Zwischensubjektfaktor, und die Temperatur ist ein Zwischensubjektfaktor. Nach Ihrer Antwort sollte es also sein(1|recipe/replicate)
. Nein?(1|replicate:recipe)
ist wahrscheinlich gleichwertig.cake
auf nur ein einziges Rezept beschränken. In Bezug auf den dritten Punkt, von dem Sie sagen, dass Sie nicht sicher sind, woher er kommt, lesen Sie bitte den allerletzten Link in meinem Q mit einem Beispiel für drei subjektinterne Faktoren. Siehe auch Jakes upvoted Kommentar unter diesem Q, in dem er zufällige Steigungen erwähnt.aov
Sie haben Sie Recht, dass es den Anschein hatError(subject/A)
und SieError(subject)
die gleichen Ergebnisse erzielen, wenn es keine anderen Faktoren gibt, sondern ein Beispiel aus dem verknüpften Thread mit zwei Faktoren nehmen und dortError(subject/(A*B))
undError(subject)
nicht gleichwertig sind. Mein gegenwärtiges Verständnis ist, dass es ist, weil das erstere zufällige Steigungen enthält.cake
Datensatz war kein gutes Beispiel. Entschuldigen Sie. Ich werde etwas genauer darauf eingehen und wahrscheinlich versuchen, einen besseren zur Veranschaulichung zu finden.Hoppla. Alarmkommentatoren haben festgestellt, dass mein Post voller Unsinn war. Ich habe verschachtelte Entwürfe und wiederholte Maßentwürfe verwirrt.
Diese Site bietet eine nützliche Aufschlüsselung der Unterschiede zwischen verschachtelten und wiederholten Kennzahlenentwürfen. Interessanterweise zeigt der Autor die erwarteten mittleren Quadrate für fest in fest, zufällig in fest und zufällig in zufällig - aber nicht fest in zufällig. Es ist schwer vorstellbar, was das bedeuten würde - wenn die Faktoren in Stufe A zufällig ausgewählt werden, entscheidet jetzt die Zufälligkeit über die Auswahl der Faktoren in Stufe B. Wenn 5 Schulen zufällig von einer Schulbehörde ausgewählt werden und dann 3 Lehrer Die Stufen des "Lehrer" -Faktors, die aus jeder Schule (in Schulen verschachtelten Lehrern) ausgewählt werden, sind nun eine zufällige Auswahl von Lehrern aus der Schulbehörde aufgrund der zufälligen Auswahl von Schulen. Ich kann die Lehrer, die ich im Experiment haben werde, nicht "reparieren".
quelle