Verschiedene Beschreibungen zur Modellauswahl für zufällige Effekte von linearen gemischten Modellen weisen an, REML zu verwenden. Ich kenne den Unterschied zwischen REML und ML auf einer bestimmten Ebene, aber ich verstehe nicht, warum REML verwendet werden sollte, weil ML voreingenommen ist. Ist es beispielsweise falsch, mit ML eine LRT für einen Varianzparameter eines Normalverteilungsmodells durchzuführen (siehe folgenden Code)? Ich verstehe nicht, warum es bei der Modellauswahl wichtiger ist, unvoreingenommen zu sein als ML. Ich denke, die ultimative Antwort muss lauten: "Weil die Modellauswahl mit REML besser funktioniert als mit ML", aber ich möchte ein bisschen mehr darüber wissen. Ich habe die Ableitungen von LRT und AIC nicht gelesen (ich bin nicht gut genug, um sie gründlich zu verstehen), aber wenn REML explizit in den Ableitungen verwendet wird, muss ich nur wissen, dass dies tatsächlich ausreicht (z. B.
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value
Antworten:
Eine sehr kurze Antwort: Das REML ist ein ML, der auf REML basierende Test ist also trotzdem korrekt. Da die Schätzung der Varianzparameter mit REML besser ist, ist es natürlich, diese zu verwenden.
Warum ist REML eine ML? Betrachten wir zum Beispiel ein Modell mit X ∈ R n × p , Z ∈ R n x q und β ∈ R p der Vektor der feststehenden Effekte, u ~ N ( 0 , τ I q ) ist der Vektor von Zufallseffekten und e ~ N ( 0 , σ 2 I n
quelle
Likelihood-Ratio-Tests sind statistische Hypothesentests, die auf einem Verhältnis von zwei Wahrscheinlichkeiten basieren. Ihre Eigenschaften sind mit der Maximum Likelihood Estimation (MLE) verknüpft. (siehe zB Maximum Likelihood Estimation (MLE) in Laienbegriffen ).
In Ihrem Fall (siehe Frage) möchten Sie zwischen zwei verschachtelten var-covar-Modellen wählen. Nehmen wir an, Sie möchten zwischen einem Modell mit dem var-covar-Wert und einem Modell mit dem var-covar-Wert Σ wählen s wobei das zweite (einfaches Modell) ein Sonderfall des ersten (allgemeines Modell) ist.Σg Σs
Der Test basiert auf der Likelihood - Verhältnis . Wo Σ s und Σ gLR=−2(log(Ls(Σ^s))−log(Lg(Σ^g)) Σ^s Σ^g sind die Maximum-Likelihood-Schätzer.
Die Statistik ist asymptotisch (!) Χ 2LR χ2 .
Maximum-Likelihood-Schätzer sind bekanntermaßen konsistent, in vielen Fällen jedoch voreingenommen. Dies ist der Fall für den MLE Schätzer für die und Σ g , kann es zeigen, dass sie vorgespannt sind. Dies liegt daran, dass sie mit einem Mittelwert berechnet werden, der aus den Daten abgeleitet wurde, sodass die Streuung um diesen 'geschätzten Durchschnitt' kleiner ist als die Streuung um den wahren Mittelwert (siehe z. B. intuitive Erklärung zur Division durch n - 1 bei der Berechnung der Standardabweichung) ? )Σ^s Σ^g n−1
Note that REML should only be used to choose among nested var-covar structures of models with the same mean, for models with different means, the REML is not appropriate, for models with different means one should use ML.
quelle
I have an answer that has more to do with common sense than with Statistics. If you take a look at PROC MIXED in SAS, the estimation can be performed with six methods:
http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mixed_sect008.htm
but REML is the default. Why? Apparently, the practical experience showed it has the best performance (e.g., the smallest chance of convergence problems). Therefore, if your goal is achievable with REML, then it makes sense to use REML as opposed to the other five methods.
quelle