Ich bin verwirrt darüber, wie die posteriore prädiktive Verteilung für die Bayes'sche lineare Regression nach dem hier auf Seite 3 beschriebenen und unten kopierten Grundfall bewertet werden soll.
Der Grundfall ist dieses lineare Regressionsmodell:
Wenn wir entweder einen einheitlichen Prior auf mit einem Scale-Inv vor oder den Normal-Inverse-Gamma-Prior (siehe hier ) verwenden, ist die posteriore Vorhersageverteilung analytisch und ist Student t. χ 2 σ 2
Was ist mit diesem Modell?
Wenn , aber bekannt ist, ist die posteriore Vorhersageverteilung multivariate Gaußsche. Normalerweise kennen Sie , müssen es aber schätzen. Vielleicht sagst du seine Diagonale und machst die Diagonale in irgendeiner Weise zu einer Funktion der Kovariaten. Dies wird im Kapitel über die lineare Regression der Bayes'schen Datenanalyse von Gelman erörtert .Σ Σ
Gibt es in diesem Fall eine analytische Form für die posteriore Vorhersageverteilung? Kann ich meine Schätzung einfach in einen multivariaten Schüler t einfügen? Wenn Sie mehr als eine Varianz schätzen, ist die Verteilung immer noch multivariate Schüler t?
Ich frage , weil ich einige sagen haben bereits auf der Hand. Ich möchte wissen, ob es wahrscheinlicher ist, dass es beispielsweise durch lineare Regression A, lineare Regression B vorhergesagt wurde
Antworten:
Wenn Sie eine einheitliche vor auf nehmen , dann die hintere für ist mit Um die prädiktive Verteilung zu finden, benötigen wir weitere Informationen. Wenn und bedingt unabhängig von bei , dann ist Aber normalerweise sind und für diese nicht bedingt unabhängig, sondern haben wir normalerweise β β | y ~ N ( β , V β ) . Β = [ X ' Σ - 1 X ] X ' yβ β
quelle
Unter nicht informativen oder multivariaten Normal-Wishart-Prioritäten haben Sie die analytische Form als multivariate Schülerverteilung für eine klassische mutlivariate multiple Regression. Ich denke, die Entwicklungen in diesem Dokument hängen mit Ihrer Frage zusammen (vielleicht gefällt Ihnen Anhang A :-)). Normalerweise habe ich das Ergebnis mit einer posterioren Vorhersageverteilung verglichen, die mit WinBUGS und der analytischen Form erhalten wurde: Sie sind genau gleichwertig. Das Problem wird nur dann schwierig, wenn Sie in Modellen mit gemischten Effekten zusätzliche zufällige Effekte haben, insbesondere bei unausgeglichenem Design.
Im Allgemeinen sind bei klassischen Regressionen y und ỹ bedingt unabhängig (Residuen sind iid)! Wenn dies nicht der Fall ist, ist die hier vorgeschlagene Lösung natürlich nicht korrekt.
In R (hier Lösung für einheitliche Prioritäten) wird unter der Annahme, dass Sie ein lm-Modell (mit dem Namen "Modell") einer der Antworten in Ihrem Modell erstellt und als "Modell" bezeichnet haben, wie Sie die multivariate Vorhersageverteilung erhalten
Jetzt sind Quantile von ysim Beta-Erwartungstoleranzintervalle von der Vorhersageverteilung. Sie können die Stichprobenverteilung natürlich direkt verwenden, um zu tun, was Sie wollen.
quelle