Auf R-sig-ME gibt es mehrere Themen zum Erhalten von Konfidenzintervallen für Vorhersagen mit lme4
und nlme
in R. Zum Beispiel hier und hier im Jahr 2010, einschließlich einiger Kommentare von Dougals Bates, einem der Autoren beider Pakete. Ich zögere, ihn wörtlich zu zitieren, aus Angst, dass sie aus dem Zusammenhang gerissen werden, aber ein Kommentar, den er macht, ist
"Sie kombinieren Parameter und Zufallsvariablen in Ihren Vorhersagen, und ich bin mir nicht sicher, was es bedeuten würde, die Variabilität dieser Vorhersagen zu bewerten. Ein Bayesianer kann es vielleicht verstehen, aber ich kann es nicht verstehen. "" https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
Ich weiß, dass das Bayes'sche glmm-Paket MCMCglmm
glaubwürdige Intervalle für Vorhersagen liefern kann.
In letzter Zeit wurde der Entwicklungsversion von lme4
on github eine predict
Methode gegeben, die jedoch von folgendem Kommentar begleitet wird:
"@note Es gibt keine Option zum Berechnen von Standardfehlern von Vorhersagen, da es schwierig ist, eine effiziente Methode zu definieren, die Unsicherheit in die Varianzparameter einbezieht. Wir empfehlen für diese Aufgabe \ code {\ link {bootMer}}." https://github.com/lme4/lme4/blob/master/R/predict.R
Warum ist es also schwierig, Unsicherheit in zufällige Effekte einzubeziehen, wenn Vorhersagen aus gemischten Modellen in einer frequentistischen Umgebung getroffen werden?
quelle
Ich habe mich lange über die scheinbar verbreitete Überzeugung gewundert, dass es einen grundlegenden Unterschied zwischen festen und zufälligen Effekten für (im Allgemeinen nichtlineare) Modelle mit gemischten Effekten gibt. Dieser Glaube wird zum Beispiel von Bates in der folgenden Antwort angegeben
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
Bates gibt klar an, dass er glaubt, dass es einen grundlegenden Unterschied zwischen festen und zufälligen Effekten gibt, so dass sie nicht kombiniert werden können. Ich denke, er liegt falsch und ich hoffe, einige Leser von einer alternativen Sichtweise zu überzeugen. Ich verfolge einen frequentistischen Ansatz. Ich möchte also einen Begriff der Profilwahrscheinlichkeit für eine Funktion sowohl der festen als auch der zufälligen Effekte definieren. Um die Diskussion zu motivieren, nehmen wir an, wir haben ein Zwei-Parameter-Modell mit den Parametern x und u (bisher nichts über zufällige Effekte). Sei die Wahrscheinlichkeitsfunktion, bei der wir jeden Verweis auf die Daten unterdrücken. Sei eine beliebige (schöne) Funktion von x und u. Die Profilwahrscheinlichkeit für die Funktion ist gegeben durchg ( x , u ) P g ( t ) gL(x,u) g(x,u) Pg(t) g
Ich glaube, dass niemand damit streiten würde. Nehmen wir nun an, wir haben eine vorherige Wahrscheinlichkeitsverteilung für u. Dann würde ich behaupten, dass die Profilwahrscheinlichkeit für immer noch sinnvoll ist, aber wir sollten (1) ändern, indem wir den Prior einbeziehen.p(u) g
Um Informationen über die Funktion , sollten wir nicht über den Parameter . Aber was passiert in dem Fall, in dem es viele zufällige Effektparameter gibt? Dann behaupte ich, wir sollten uns über "die meisten" integrieren, aber nicht alle in einem Sinne, den ich präzisieren werde. Um die Konstruktion zu motivieren, gebe es zufällige Effekte . Betrachten Sie den Sonderfall, in dem die Funktion nur von abhängt und tatsächlich die einfachste vorstellbare Funktion ist, . Integriere über die zufälligen Effekte , um zu erhalteng(x,u) u n u=(u1,u2,...,un−1,un) g(x,u) un g(x,u)=un u1,u2,...,un−1
Für eine allgemeine Funktion bilden wir die durch definierte Funktion und berechnen die Profilwahrscheinlichkeitg(x,u) F(x,s) (5)
Diese Profilwahrscheinlichkeit ist ein genau definiertes Konzept und steht für sich allein. Um jedoch in der Praxis nützlich zu sein, muss man in der Lage sein, seinen Wert zumindest ungefähr zu berechnen. Ich glaube, dass für viele Modelle die Funktion mit einer Variante der Laplace-Näherung gut genug approximiert werden kann. Definieren Sie durch Sei H der Hessische des Logs der Funktion in Bezug auf die Parameter und .F(x,s) x^(s),u^(s)
Die Niveausätze von sind dimensionale Untervielfalt eines dimensionalen Raums, in dem es feste Effekte und zufällige Effekte gibt. Wir müssen eine Form über diesen Verteiler integrieren, wobei alles bei linearisiert ist. Dies beinhaltet ein bisschen elementare Differentialgeometrie. Angenommen, Durch Umparametrieren können wir annehmen, dass und . Dann betrachten Sie die Karteg m+n−1 n+m m n n du1∧du2∧…∧dun x^(s),u^(s) gxn(x^(s),u^(s))≠0 x^(s)=0 u^(s)=0
Der Rückzug des Hessischen ist die quadratische Form
Das Integral kann also über die Laplace-Näherung berechnet (oder angenähert) werden. Dies ist die übliche Formel, die den Logarithmus der Determinante von , der über die Cholesky-Zerlegung berechnet wird. Der Wert der Laplace-Näherung des Integrals ist wobeiist die Determinante. Wir müssen uns noch mit der Breite des Level-Sets von als befassen. Um dies zuerst zu bestellen, hat dies den Wert Dabei ist der Vektor partieller Ableitungen vonT
quelle