REML vs ML stepAIC

10

Ich fühle mich überwältigt, nachdem ich versucht habe, mich mit der Literatur zu befassen, wie ich meine gemischte Modellanalyse durchführen kann, um anschließend mit AIC das beste Modell oder die besten Modelle auszuwählen. Ich denke nicht, dass meine Daten so kompliziert sind, aber ich suche nach einer Bestätigung, dass das, was ich getan habe, korrekt ist, und berate dann, wie ich vorgehen soll. Ich bin mir nicht sicher, ob ich lme oder lmer verwenden soll und dann mit einem von beiden, ob ich REML oder ML verwenden soll.

Ich habe einen Auswahlwert und möchte wissen, welche Kovariaten diesen Wert am besten beeinflussen und Vorhersagen zulassen. Hier sind einige zusammengesetzte Beispieldaten und mein Code für meinen Test, mit dem ich arbeite:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

Ich habe ~ 19 Modelle, die diese Daten mit verschiedenen Kombinationen und bis zu 2-Wege-Interaktionstermen untersuchen, aber immer mit ID als Zufallseffekt und comp1 als abhängige Variable.

  • Q1. Welche verwenden? lme oder lmer? ist es wichtig

In beiden Fällen habe ich die Möglichkeit, ML oder REML zu verwenden - und ich bekomme drastisch unterschiedliche Antworten -, wenn ich ML gefolgt von AIC verwende. Am Ende habe ich 6 Modelle, alle mit ähnlichen AIC-Werten, und die Modellkombinationen sind einfach nicht sinnvoll, während REML führt dazu, dass 2 der wahrscheinlichsten Modelle die besten sind. Beim Ausführen von REML kann ich anova jedoch nicht mehr verwenden.

  • Q2. ist der Hauptgrund für die Verwendung von ML über REML aufgrund der Verwendung mit ANOVA? Das ist mir nicht klar.

Ich kann stepAIC immer noch nicht ausführen oder kenne keinen anderen Weg, um diese 19 Modelle einzugrenzen.

  • Q3. Gibt es an dieser Stelle eine Möglichkeit, stepAIC zu verwenden?
Kerry
quelle
3
Für Q2 ist ML erforderlich, da Vergleiche mit REML nicht gültig sind, wenn sich die festen Effekte ändern. Eine mögliche nützliche verwandte Frage ist hier: stats.stackexchange.com/a/16015/3601
Aaron verließ Stack Overflow
@ Aaron Ich hatte mir diese Frage schon einmal angesehen, war aber immer noch verwirrt. Verwenden Sie REML nur "funktioniert", wenn sich der zufällige Effekt ändert? Ich verstehe offensichtlich nicht genug von ML gegen REML. Danke aber, das hilft bei einer meiner Fragen!
Kerry
Ja, das ist richtig. Beim Vergleich von Modellen sollte REML nur verwendet werden, wenn die Modelle dieselben festen Effekte haben. Antwort unten erweitert.
Aaron verließ Stack Overflow

Antworten:

16

Q1. Welche verwenden? lme oder lmer? ist es wichtig Beides ist in Ordnung. Sie geben Ihnen die gleichen Passungen. lmewird Ihnen p-Werte geben und lmerwird es nicht, aber das ist mehr als ich hier eingehen möchte. Die bekannteste Referenz ist einer von Doug Bates 'Posts auf der R-Help-Mailingliste hier .

(Einschränkung: Sie verwenden leicht unterschiedliche Algorithmen, sodass es möglicherweise einige rechenintensive Fälle gibt, in denen der eine oder andere möglicherweise besser abschneidet. Diese sind jedoch in der Praxis sehr selten und weisen höchstwahrscheinlich auf eine Art Modellfehlspezifikation hin. Siehe Völlig anders Ergebnisse von lmer () und lme () .)

Q2. ist der Hauptgrund für die Verwendung von ML über REML aufgrund der Verwendung mit ANOVA? Das ist mir nicht klar. ML ist erforderlich, da Vergleiche mit REML nicht gültig sind, wenn sich die festen Effekte ändern. Eine mögliche nützliche Frage ist hier: https://stats.stackexchange.com/a/16015/3601 . Um Ihre Frage im obigen Kommentar zu beantworten: Ja, beim Vergleichen von Modellen sollte REML nur verwendet werden, wenn die Modelle dieselben festen Effekte haben (dh wenn sich nur die zufälligen Effekte ändern). Die REML-Wahrscheinlichkeit hängt davon ab, welche festen Effekte im Modell enthalten sind, und ist daher nicht vergleichbar, wenn sich die festen Effekte ändern. Es wird jedoch allgemein davon ausgegangen, dass REML bessere Schätzungen für die zufälligen Effekte liefert. Daher ist es üblich, Ihr bestes Modell mithilfe von REML für Ihre endgültige Schlussfolgerung und Berichterstattung anzupassen.

Q3. Gibt es an dieser Stelle eine Möglichkeit, stepAIC zu verwenden? Um zwischen Ihren 19 Modellen zu vergleichen, die in Ihrer Situation sinnvoll sind, vergleichen Sie einfach den AIC für alle. Kein Grund, überhaupt schrittweise vorzugehen. Schrittweise Verfahren werden heutzutage allgemein als altmodisch angesehen, da sie nicht garantieren, dass das beste Modell gefunden wird, und Computer es einfach machen, viele Modelle zu vergleichen.

Aaron verließ Stack Overflow
quelle
1

Beim weiteren Graben habe ich auch diese Ressourcen gefunden, die die von Aaron bereitgestellten Links unterstützen und gute Lesungen für diejenigen sind, die wie ich anfangen. In den auf http://lme4.r-forge.r-project.org/ verlinkten Kapiteln finden Sie Beispiele unter dem Folienlink http://lme4.r-forge.r-project.org/slides/ auf derselben Projektseite . Viele der kurzen Kurse haben sogar Beispiel-R-Code, was eine große Hilfe war.
Auch diese kurze Antwort von Dr. Bolker http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Kerry
quelle