Meine Frage ist sehr eng im Zusammenhang mit einem frühen Beitrag den Fehler () Begriff in ANOVA mit wiederholten Messungen in R angeben . Ich möchte jedoch mehr Einblick in die Definition des Fehlerbegriffs erhalten.
Angenommen, ich habe eine bidirektionale wiederholte ANOVA. Der Faktor für den Gruppeneffekt ist die Behandlung (Kontrolle vs. Placebo), während die Zeit der gruppeninterne Effekt ist, der viermal wiederholt gemessen wird (T1 ~ T4). Patienten-ID werden als Subjekt aufgezeichnet. Hier habe ich die Daten aus einem Beispiel aus dem Tutorial in http://gjkerns.github.io/R/2012/01/20/power-sample-size.html ausgeliehen, damit die Daten so aussehen
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
So wenden Sie ANOVA an:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Ich habe auch den anderen Fehlerbegriff ausprobiert:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Kann mir jemand helfen, die Unterschiede zwischen diesen beiden Fehlerbegriffen zu erklären? Wenn der erste Term der richtige ist, was bedeuten die Ergebnisse des zweiten Fehlerterms?
Update von @amoeba: Die beiden Ausgänge sind gleich, so dass es in diesem Fall keinen Unterschied gibt, aber die Frage bleibt, was der Unterschied im Prinzip ist . Sind Error(subject)
und Error(subject/time)
immer das Gleiche?
quelle
time
), dann wird,Error(subject)
undError(subject/time)
wird für verschiedene F- und P-Werte ergebentime
.Antworten:
Erstens
subject/time
ist die Notation fürtime
verschachteltsubject
und erweitert sich so auf zwei Teilesubject
und diesubject:time
Interaktion. Die Frage wird also genauer: Wann sollte man diesubject:time
Interaktion spezifizieren und welchen Unterschied macht sie?Vor der Beantwortung dieser Frage ist es wichtig zu wissen, dass alle Modelle einen zusätzlichen Fehlerterm enthalten, der nicht angegeben werden muss. Dies ist der Fehlerterm, der den einzelnen Messungen zugeordnet ist (die niedrigste Ebene, wenn Sie dies hierarchisch betrachten).
In diesem Fall ist die
subject:time
Interaktion die niedrigste Ebene, die immer im Modell enthalten ist. Verwenden Sie alsoError(subject)
undError(subject/time)
geben Sie das gleiche Ergebnis. Der einzige Unterschied besteht darin, dass in der Ausgabe diese ErgebnisebeneWithin
für die erste undsubject:time
für die zweite aufgerufen wird .In Fällen, in denen bei jeder
subject/time
Kombination mehrere Messungen durchgeführt werden , muss diesubject:time
Interaktion angegeben werden, da sich diese Interaktion dann nicht auf der niedrigsten Ebene befindet.quelle
subject/time
Kombination vorliegen, warum sollten wir das unbedingt tun? Möchten Sie den Effekt vontime
relativ zursubject:time
Interaktion testen ? Dies ist im Wesentlichen der Inhalt meiner Frage hier stats.stackexchange.com/questions/286280 , daher möchte ich alle zukünftigen Leser dieses Threads einladen, dort nach konzeptionellen Begründungen zu suchen.