Ein Bayes-Faktor wird beim Bayes'schen Testen der Hypothese und der Bayes'schen Modellauswahl durch das Verhältnis zweier Grenzwahrscheinlichkeiten definiert: bei gegebener iid-Stichprobe und entsprechenden Abtastdichten und mit den entsprechenden Prioritäten und ist der Bayes-Faktor für den Vergleich der beiden Modelle
Ein Buch, das ich gerade rezensiere, hat die seltsame Aussage, dass der oben genannte Bayes-Faktor(x1,…,xn)f1(x|θ)f2(x|η)π1π2B.12( x1, … , X.n) =defm1( x1, … , X.n)m2( x1, … , X.n)=def∫∏ni = 1f1( xich| θ) π1( d & thgr; )∫∏ni = 1f2( xich| η) π2( d η)
B.12( x1, … , X.n) wird "durch Multiplikation der einzelnen [Bayes-Faktoren] gebildet" (S.118). Dies ist formal korrekt, wenn man die Zerlegung
aber ich sehe in dieser Zerlegung keinen Rechenvorteil als das Update durch erfordert den gleichen Rechenaufwand wie die ursprüngliche Berechnung vonB.12(x1, … ,X.n)= m1(x1, … ,X.n)m2(x1, … ,X.n)= m1(xn|x1, … , X.n - 1)m2(xn|x1, … , X.n - 1)× m1( xn - 1| xn - 2, … ,X.1)m2( xn - 1| xn - 2, … ,X.1)× ⋯⋯ × m1(x1)m2(x1)
m1(xn|x1, … , X.n - 1)m2(xn|x1, … , X.n - 1)
m1(x1, … ,X.n)m2(x1, … ,X.n)
außerhalb künstliche Spielzeugbeispiele.
Frage: Gibt es eine generische und rechnerisch effiziente Möglichkeit, den Bayes-Faktor von auf zu
aktualisieren , bei dem nicht die gesamten Ränder und
berechnet werden müssen ?B.12(x1, … ,X.n)B.12(x1, … , X.n + 1)m1(x1, … ,X.n)m2(x1, … ,X.n)
Meine Intuition ist, dass es neben Partikelfiltern, die tatsächlich die Bayes-Faktoren eine neue Beobachtung schätzen , keine natürliche Möglichkeit gibt, diese Frage zu beantworten .B.12(x1, … ,X.n)
Antworten:
Vermutlich besteht der Zweck einer rekursiven Gleichung für den Bayes-Faktor darin, dass Sie den Bayes-Faktor bereits für Datenpunkte berechnet haben und diesen mit einem zusätzlichen Datenpunkt aktualisieren möchten. Es scheint möglich zu sein, dies zu tun, ohne die Ränder des vorherigen Datenvektors neu zu berechnen, solange die Form der posterioren Funktion bekannt ist. Angenommen, wir kennen die Form dieser Funktion (und nehmen IID-Daten wie in Ihrer Frage an), kann die Vorhersagedichte wie folgt geschrieben werden:n πn
Daher haben Sie:
Wenn wir zwei Modellklassen über den Bayes-Faktor vergleichen, erhalten wir die rekursive Gleichung:
Dies beinhaltet immer noch die Integration über den Parameterbereich, daher stimme ich Ihrer Ansicht zu, dass es keinen Rechenvorteil zu geben scheint, wenn nur der Bayes-Faktor über die von Ihnen angegebene Anfangsformel neu berechnet wird. Sie können jedoch sehen, dass Sie hierfür die Ränder für den vorherigen Datenvektor nicht neu berechnen müssen. (Stattdessen berechnen wir die Vorhersagedichten des neuen Datenpunkts unter der Bedingung vorheriger Daten unter jeder der Modellklassen.) Wie Sie sehe ich keinen rechnerischen Vorteil davon, es sei denn, diese Integralformel vereinfacht sich leicht. Ich nehme an, es gibt Ihnen auf jeden Fall eine andere Formel zum Aktualisieren des Bayes-Faktors.
quelle