Dies wurde auch bei Computational Science gefragt .
Ich versuche, eine Bayes'sche Schätzung einiger Koeffizienten für eine Autoregression mit 11 Datenproben zu berechnen: wobei ist Gauß mit Mittelwert 0 und Varianz Die vorherige Verteilung auf dem Vektor ist Gauß mit Mittelwert und einer diagonalen Kovarianzmatrix mit diagonale Einträge gleich .
Basierend auf der Autoregressionsformel bedeutet dies, dass die Verteilung der Datenpunkte ( ) normal mit dem Mittelwert und der Varianz . Somit wäre die Dichte für alle Datenpunkte gemeinsam (unter der Annahme, dass die Unabhängigkeit für das von mir geschriebene Programm in Ordnung ist):
Nach dem Bayes'schen Theorem können wir das Produkt der obigen Dichte mit der vorherigen Dichte nehmen, und dann brauchen wir nur die Normalisierungskonstante. Meine Vermutung ist, dass dies eine Gaußsche Verteilung sein sollte, so dass wir uns am Ende um die Normalisierungskonstante kümmern können, anstatt sie explizit mit Integralen über und berechnen .
Dies ist der Teil, mit dem ich Probleme habe. Wie berechne ich die Multiplikation der vorherigen Dichte (die multivariat ist) und dieses Produkts der univariaten Datendichten? Der hintere Teil muss nur eine Dichte von und , aber ich kann nicht sehen, wie Sie das aus einem solchen Produkt herausholen können.
Alle Hinweise sind wirklich hilfreich, auch wenn Sie mich nur in die richtige Richtung weisen und ich dann die unordentliche Algebra ausführen muss (was ich bereits mehrmals versucht habe).
Als Ausgangspunkt ist hier die Form des Zählers aus Bayes 'Regel:
Das Problem ist, wie man sieht, dass dies auf eine Gaußsche Dichte von .
Hinzugefügt
Letztendlich läuft dies auf das folgende allgemeine Problem hinaus. Wenn Sie einen quadratischen Ausdruck wie wie bringen Sie das in eine quadratische Form für eine 2x2-Matrix ? Es ist in einfachen Fällen einfach genug, aber welchen Prozess verwenden Sie, um die mittleren Schätzungen und ?
Beachten Sie, dass ich die einfache Möglichkeit ausprobiert habe, die Matrixformel zu erweitern und dann zu versuchen, die Koeffizienten wie oben darzustellen. In meinem Fall ist das Problem, dass die Konstante Null ist und ich dann drei Gleichungen in zwei Unbekannten erhalte, so dass es unterbestimmt ist, nur Koeffizienten abzugleichen (selbst wenn ich eine symmetrische quadratische Formmatrix annehme).
Antworten:
In meiner Antwort auf die vorherige Antwort ging es darum, zu untersuchen, wie ich die Parameter integriert habe - denn Sie werden hier genau die gleichen Integrale verwenden. Bei Ihrer Frage wird davon ausgegangen, dass die Varianzparameter bekannt sind, sodass es sich um Konstanten handelt. Sie müssen nur die Abhängigkeit von vom Zähler betrachten. Um dies zu sehen, beachten Sie, dass wir schreiben können:α,μ
= 1
Beachten Sie, wie wir den ersten Faktor aus dem Doppelintegral auf dem Nenner, und es bricht mit dem Zähler ab. Wir können auch die Summe der Quadrateexp [ -1 ziehen1(2πσ2e)5⋅2πσ2p und es wird auch abgebrochen. Das Integral, mit dem wir übrig bleiben, ist jetzt (nach Erweiterung des quadratischen Terms):exp[−12σ2e∑11i=2Y2i]
Now we can use a general result from the normal pdf.
Let me know if you need more clues.
update
(note: correct formula, should be10μ2 instead of μ2 )
if we look at the quadratic form you've written in the update, we notice there is5 coefficients (L is irrelevant for posterior as we can always add any constant which will cancel in the denominator). We also have 5 unknowns μ^,α^,Q11,Q12=Q21,Q22 . Hence this is a "well posed" problem so long as the equations are linearly independent. If we expand the quadratic (μ−μ^,α−α^)Q(μ−μ^,α−α^)t we get:
Comparing second order coefficient we getA=Q11,B=2Q12,C=Q22 which tells us what the (inverse) covariance matrix looks like. Also we have two slightly more complicated equations for α^,μ^ after substituting for Q . These can be written in matrix form as:
Thus the estimates are given by:
Showing that we do not have unique estimates unless4AC≠B2 . Now we have:
Note that if we defineXi=Yi−1 for i=2,…,11 and take the limit σ2p→∞ then the estimates for μ,α are given by the usual least squares estimate α^=∑11i=2(Yi−Y¯¯¯¯)(Xi−X¯¯¯¯¯)∑11i=2(Xi−X¯¯¯¯¯)2 and μ^=Y¯¯¯¯−α^X¯¯¯¯ where Y¯¯¯¯=110∑11i=2Yi and X¯¯¯¯=110∑11i=2Xi=110∑10i=1Yi . So the posterior estimates are a weighted average between the OLS estimates and the prior estimate (0,0) .
quelle