Wir wissen, dass ein gepaarter t- Test nur ein Sonderfall von Einweg-ANOVA mit wiederholten Messungen (oder innerhalb des Subjekts) sowie eines linearen Mischeffektmodells ist, das mit der Funktion lme () des nlme-Pakets in R demonstriert werden kann Wie nachfolgend dargestellt.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Wenn ich den folgenden gepaarten T-Test durchführe:
t.test(x1, x2, paired = TRUE)
Ich habe folgendes Ergebnis erhalten (Sie erhalten aufgrund des Zufallsgenerators ein anderes Ergebnis):
t = -2.3056, df = 9, p-value = 0.04657
Mit dem ANOVA-Ansatz können wir das gleiche Ergebnis erzielen:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Jetzt kann ich dasselbe Ergebnis mit dem folgenden Modell erhalten, wenn ich eine positiv-definite symmetrische Korrelationsmatrix für die beiden Bedingungen annehme:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Oder ein anderes Modell, das eine zusammengesetzte Symmetrie für die Korrelationsmatrix der beiden Bedingungen annimmt:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Mit dem gepaarten t-Test und der Einweg-ANOVA mit wiederholten Messungen kann ich das traditionelle Zellenmittelwertmodell wie folgt aufschreiben
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
wobei i die Bedingung indiziert, j das Subjekt indiziert, Y ij die Antwortvariable ist, μ für den festen Effekt für den Gesamtmittelwert konstant ist, α i der feste Effekt für die Bedingung ist, β j der zufällige Effekt für das Subjekt ist, das N (0, σ folgt p 2 ) (σ p 2 ist die Populationsvarianz) und ε ij ist der Rest nach N (0, σ 2 ) (σ 2 ist die Varianz innerhalb des Subjekts).
Ich dachte, dass das obige Modell des Zellenmittelwerts nicht für die IME-Modelle geeignet wäre, aber das Problem ist, dass ich kein vernünftiges Modell für die beiden IME () -Ansätze mit der Annahme der Korrelationsstruktur finden kann. Der Grund ist, dass das IME-Modell mehr Parameter für die zufälligen Komponenten zu haben scheint, als das oben angegebene Zellenmittelwertmodell bietet. Zumindest liefert das IME-Modell genau den gleichen F-Wert, die gleichen Freiheitsgrade und den gleichen p-Wert, wie es gls nicht kann. Insbesondere liefert gls falsche DFs, da nicht berücksichtigt wird, dass jedes Subjekt zwei Beobachtungen hat, was zu stark aufgeblasenen DFs führt. Das Modell ist höchstwahrscheinlich bei der Angabe der Zufallseffekte überparametrisiert, aber ich weiß nicht, was das Modell ist und was die Parameter sind. Daher ist das Problem für mich immer noch ungelöst.
quelle
Antworten:
Die Äquivalenz der Modelle kann durch Berechnung der Korrelation zwischen zwei Beobachtungen desselben Individuums wie folgt beobachtet werden:
Beachten Sie, dass die Modelle nicht ganz gleichwertig sind, da das Zufallseffektmodell eine positive Korrelation erzwingt. Das CS-Modell und das T-Test / Anova-Modell nicht.
EDIT: Es gibt auch zwei andere Unterschiede. Erstens gehen das CS- und das Zufallseffektmodell von einer Normalität für den Zufallseffekt aus, das t-Test / Anova-Modell jedoch nicht. Zweitens werden die CS- und Zufallseffektmodelle mit maximaler Wahrscheinlichkeit angepasst, während die Anova mit mittleren Quadraten angepasst wird. Wenn alles im Gleichgewicht ist, werden sie übereinstimmen, aber nicht unbedingt in komplexeren Situationen. Schließlich wäre ich vorsichtig, wenn ich F / df / p-Werte aus den verschiedenen Anpassungen als Maß für die Übereinstimmung der Modelle verwenden würde. Weitere Einzelheiten finden Sie in Doug Bates 'berühmtem Estrich auf den DFs. (END EDIT)
Das Problem mit Ihrem
R
Code ist, dass Sie die Korrelationsstruktur nicht richtig angeben. Sie müssengls
mit dem verwendencorCompSymm
Korrelationsstruktur verwenden.Generieren Sie Daten, damit ein Betreff angezeigt wird:
Dann sehen Sie, wie Sie die Zufallseffekte und die zusammengesetzten Symmetriemodelle anpassen.
Die Standardfehler aus dem Zufallseffektmodell sind:
Und die Korrelation und Restvarianz aus dem CS-Modell ist:
Und sie entsprechen dem, was erwartet wird:
Andere Korrelationsstrukturen passen normalerweise nicht zu zufälligen Effekten, sondern nur durch Angabe der gewünschten Struktur. Eine häufige Ausnahme ist das AR (1) + Zufallseffektmodell, das einen Zufallseffekt und eine AR (1) -Korrelation zwischen Beobachtungen desselben Zufallseffekts aufweist.
EDIT2: Wenn ich die drei Optionen anpasse, erhalte ich genau die gleichen Ergebnisse, außer dass gls nicht versucht, den df für den gewünschten Begriff zu erraten.
(Der Achsenabschnitt ist hier anders, da bei der Standardcodierung nicht der Mittelwert aller Subjekte, sondern der Mittelwert des ersten Subjekts angegeben wird.)
Es ist auch interessant festzustellen, dass das neuere
lme4
Paket die gleichen Ergebnisse liefert, aber nicht einmal versucht, einen p-Wert zu berechnen.quelle
Sie können auch die Verwendung von function
mixed
in packageafex
in Betracht ziehen , um p-Werte mit der Kenward-Roger-df-Näherung zurückzugeben, die identische p-Werte als gepaarten t-Test zurückgibt:Oder
quelle