Zitat für ML vs. REML

7

Kurze Frage: Kann mir jemand ein Zitat geben, mit dem ich die Verwendung von ML bei Modellvergleichen rechtfertigen kann?

Hintergrund: Ich passe einige mehrstufige Modelle mit lme4 in R an und führe eine Reihe von Modellvergleichen durch. Ein Rezensent sagte mir, ich sollte REML (niemals ML) nur verwenden, wenn ein Modell ausgeführt oder Modelle verglichen werden. Ich habe seitdem genau das Gegenteil in Bezug auf Modellvergleiche gehört, und mir wurde an anderer Stelle gesagt, dass ML in Ordnung ist. Die Modelle sind nicht komplex ... ein oder zwei Level-2-Prädiktoren ohne Level-1-Prädiktoren. Schön und einfach.

Ich würde gerne (1) bestätigen, dass ich ein Modell ohne REML [jemals] und ein Zitat dafür gültig ausführen kann, und (2) eine Form von Zitat, die besagt, dass Sie ML (NICHT REML) benötigen, wenn Sie LRT-Vergleiche (BIC und AIC) durchführen unterstütze mich auch, aber ich wollte einen p-Wert, der sie begleitet).

Jeder Rat, den Sie geben, wenn Sie Zitate haben, wäre großartig, da meine Rezensenten sie wollen.

Beste,

Tom Carpenter
quelle

Antworten:

7

Seufzer.

  • Der Vergleich von Modellen, die mit REML ausgestattet sind und sich in ihren festen Effekten unterscheiden, macht niemals Sinn.
  • Die Verwendung von AIC / BIC / p-Werten zum Vergleich des gleichen Modells mit REML mit ML ist niemals sinnvoll. Sie müssen die Entscheidung treffen, welche Methode aus theoretischen Gründen von vornherein angewendet werden soll.
  • Der Vergleich von Modellen, die mit REML ausgestattet sind und sich in ihren zufälligen Effekten unterscheiden, ist gerechtfertigt.

Dies wird in (aber nur nebenbei) erwähnt

Bates D, Maechler M, Bolker BM und Walker S (2014). "Lme4: Lineare Mischeffektmodelle mit Eigen und S4." ArXiv E-Print; im Druck, Journal of Statistical Software : http://arxiv.org/abs/1406.5823

Für Objekte der Klasse lmerMod besteht das Standardverhalten darin, die Modelle mit ML umzurüsten, wenn sie mit REML = TRUE ausgestattet sind. Dies ist erforderlich, um beim Vergleich von Modellen, die sich in ihren festen Effekten unterscheiden, sinnvolle Antworten zu erhalten ...

Und genauer gesagt, Pinheiro und Bates Mixed-Effects-Modelle in S und S-PLUS 2000 (Springer) p. 87 (Auszüge aus Google Books):

Wenn sich zwei verschachtelte Modelle in der Spezifikation ihrer Begriffe mit festen Effekten unterscheiden, kann ein Likelihood-Ratio-Test nur für Anpassungen mit maximaler Wahrscheinlichkeit definiert werden. Wie in Abschnitt 2.2.5 beschrieben, ist ein Likelihood-Ratio-Test für REML-Anpassungen nicht möglich, da das REML-Kriterium einen Begriff enthält, der sich mit der Änderung der Spezifikation für feste Effekte ändert.

... sie weisen darauf hin, dass LRT asymptotisch ist und dass Effekte endlicher Größe (das gefürchtete Problem der "Nennerfreiheitsgrade") solche Tests antikonservativ machen können.

Diese Frage enthält ein Zitat aus Discovering Statistics Using SPSS 4e , das auch diese Aussage stützt (dh es handelt sich nicht nur um R-using-Verrückte).

Ben Bolker
quelle