So schreiben Sie den Fehlerterm in wiederholten Messungen ANOVA in R: Fehler (Betreff) vs Fehler (Betreff / Zeit)

10

Meine Frage ist sehr eng im Zusammenhang mit einem frühen Beitrag den Fehler () Begriff in ANOVA mit wiederholten Messungen in R angeben . Ich möchte jedoch mehr Einblick in die Definition des Fehlerbegriffs erhalten.

Angenommen, ich habe eine bidirektionale wiederholte ANOVA. Der Faktor für den Gruppeneffekt ist die Behandlung (Kontrolle vs. Placebo), während die Zeit der gruppeninterne Effekt ist, der viermal wiederholt gemessen wird (T1 ~ T4). Patienten-ID werden als Subjekt aufgezeichnet. Hier habe ich die Daten aus einem Beispiel aus dem Tutorial in http://gjkerns.github.io/R/2012/01/20/power-sample-size.html ausgeliehen, damit die Daten so aussehen

 Time Subject Method      NDI
 0min    1     Treat 51.01078
 15min   1     Treat 47.12314
 48hrs   1     Treat 26.63542
 96hrs   1     Treat 20.78196
 0min    2     Treat 42.61345
 15min   2     Treat 32.77171

So wenden Sie ANOVA an:

aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1              

Error: Subject:Time        
            Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45 

Ich habe auch den anderen Fehlerbegriff ausprobiert:

aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)

Error: Subject      
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1               

Error: Within
             Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

Kann mir jemand helfen, die Unterschiede zwischen diesen beiden Fehlerbegriffen zu erklären? Wenn der erste Term der richtige ist, was bedeuten die Ergebnisse des zweiten Fehlerterms?

Update von @amoeba: Die beiden Ausgänge sind gleich, so dass es in diesem Fall keinen Unterschied gibt, aber die Frage bleibt, was der Unterschied im Prinzip ist . Sind Error(subject)und Error(subject/time)immer das Gleiche?

tiantianchen
quelle
3
Entschuldigung, ich habe gerade festgestellt, dass diese beiden Begriffe die gleichen Ergebnisse liefern. Also ich denke sie sind die gleichen :-)
Tiantianchen
1
Ich hatte auf eine Erklärung gehofft: /
vipin8169
Alles, was ich über den Fehlerbegriff herausfinden kann, ist dieser >> "In einem Entwurf mit wiederholten Maßnahmen müssen wir einen Fehlerbegriff angeben, der die natürliche Variation von Teilnehmer zu Teilnehmer berücksichtigt. (ZB könnte ich auf gruselige Musik etwas anders reagieren als Sie tun, weil ich Zombiefilme liebe und du sie hasst!) Wir tun dies mit der Funktion Error (): Insbesondere sagen wir, dass wir diese Variation zwischen den Teilnehmern über alle unsere subjektinternen Variablen hinweg kontrollieren wollen. "
Vipin8169
(+1) Sie sind nur dann äquivalent, wenn es genau 1 Messung pro Subjekt / Zeit-Kombination gibt. Wenn es mehr Messungen pro Subjekt / Zeit - Kombination ist (entweder einfach , weil Messungen wurden wiederholt, oder weil es ein anderes innerhalb Subjekts Faktor B, zusätzlich zu time), dann wird, Error(subject)und Error(subject/time)wird für verschiedene F- und P-Werte ergeben time.
Amöbe sagt Reinstate Monica
Dieselbe Frage auf SO: stackoverflow.com/questions/37497948 - leider auch ohne vollständig zufriedenstellende Antworten (imho).
Amöbe sagt Reinstate Monica

Antworten:

2

Erstens subject/timeist die Notation für timeverschachtelt subjectund erweitert sich so auf zwei Teile subjectund die subject:timeInteraktion. Die Frage wird also genauer: Wann sollte man die subject:timeInteraktion spezifizieren und welchen Unterschied macht sie?

Vor der Beantwortung dieser Frage ist es wichtig zu wissen, dass alle Modelle einen zusätzlichen Fehlerterm enthalten, der nicht angegeben werden muss. Dies ist der Fehlerterm, der den einzelnen Messungen zugeordnet ist (die niedrigste Ebene, wenn Sie dies hierarchisch betrachten).

In diesem Fall ist die subject:timeInteraktion die niedrigste Ebene, die immer im Modell enthalten ist. Verwenden Sie also Error(subject)und Error(subject/time)geben Sie das gleiche Ergebnis. Der einzige Unterschied besteht darin, dass in der Ausgabe diese Ergebnisebene Withinfür die erste und subject:timefür die zweite aufgerufen wird .

In Fällen, in denen bei jeder subject/timeKombination mehrere Messungen durchgeführt werden , muss die subject:timeInteraktion angegeben werden, da sich diese Interaktion dann nicht auf der niedrigsten Ebene befindet.

Aaron verließ Stack Overflow
quelle
(Ich hatte ein offenes Kopfgeld für diese Frage, aber es ist gestern leider ausgegangen ...) +1, aber ich denke, diese Antwort umgeht das, was hier das zentrale Problem sein könnte: Wenn mehrere Messungen pro subject/timeKombination vorliegen, warum sollten wir das unbedingt tun? Möchten Sie den Effekt von timerelativ zur subject:timeInteraktion testen ? Dies ist im Wesentlichen der Inhalt meiner Frage hier stats.stackexchange.com/questions/286280 , daher möchte ich alle zukünftigen Leser dieses Threads einladen, dort nach konzeptionellen Begründungen zu suchen.
Amöbe sagt Reinstate Monica
Außerdem gibt es hier sehr ähnliche Fragen und Antworten : stats.stackexchange.com/questions/247582 .
Amöbe sagt Reinstate Monica