Ich habe kürzlich begonnen, Regressionsmischmodelle im Bayes'schen Rahmen unter Verwendung eines MCMC-Algorithmus (Funktion MCMCglmm in R) anzupassen.
Ich glaube, ich habe verstanden, wie man die Konvergenz des Schätzprozesses diagnostiziert (Kurve, Geweke-Plot, Autokorrelation, posteriore Verteilung ...).
Eines der Dinge, die mir im Bayes'schen Rahmen auffallen, ist, dass viel Aufwand für diese Diagnostik aufgewendet zu werden scheint, während sehr wenig für die Überprüfung der Residuen des angepassten Modells getan zu werden scheint. Beispielsweise existiert in MCMCglmm die Funktion residual.mcmc (), ist jedoch noch nicht implementiert (dh return: "Residuen, die für MCMCglmm-Objekte noch nicht implementiert sind"; dieselbe Geschichte für predict.mcmc ()). Es scheint auch in anderen Paketen zu fehlen, und allgemeiner wird es in der Literatur, die ich gefunden habe, wenig diskutiert (abgesehen von DIC, das auch ziemlich stark diskutiert wird).
Kann mir jemand nützliche Hinweise geben und im Idealfall R-Code, mit dem ich spielen oder den ich ändern könnte?
Danke vielmals.
Antworten:
Ich denke, die Verwendung des Begriffs Residuum entspricht nicht der Bayes'schen Regression. Denken Sie daran, dass in frequentistischen Wahrscheinlichkeitsmodellen die Parameter als feststehende schätzbare Größen betrachtet werden und der Datengenerierungsmechanismus ein zufälliges Wahrscheinlichkeitsmodell für beobachtete Daten aufweist. Für Bayesianer werden die Parameter von Wahrscheinlichkeitsmodellen als variabel betrachtet, und die festen Daten aktualisieren unsere Überzeugung darüber, was diese Parameter sind. Wenn Sie also die Varianz der beobachteten minus angepassten Werte in einem Regressionsmodell berechnet haben , wurde das beobachtetDie Komponente hätte eine Varianz von 0, während die angepasste Komponente als Funktion der posterioren Wahrscheinlichkeitsdichte für die Modellparameter variieren würde. Dies ist das Gegenteil von dem, was Sie aus dem Modell der frequentistischen Regression ableiten würden. Ich denke, wenn man daran interessiert wäre, die Wahrscheinlichkeitsannahmen ihres Bayes'schen Regressionsmodells zu überprüfen, hätte ein einfaches QQ-Diagramm der posterioren Dichte von Parameterschätzungen (geschätzt aus unserer MCMC-Stichprobe) gegenüber einer Normalverteilung eine diagnostische Aussagekraft, die mit der Analyse von Residuen (oder Pearson-Residuen) vergleichbar ist für nichtlineare Verknüpfungsfunktionen).
quelle