Ich bin auf diesen Artikel gestoßen, in dem steht, dass bei der Gibbs-Probenahme jede Probe akzeptiert wird. Ich bin etwas verwirrt. Wie kommt es, dass jede aufgenommene Probe zu einer stationären Verteilung konvergiert?
Im allgemeinen Metropolis-Algorithmus akzeptieren wir als min (1, p (x *) / p (x)), wobei x * der Abtastpunkt ist. Ich gehe davon aus, dass x * uns auf eine Position zeigt, an der die Dichte hoch ist, sodass wir uns zur Zielverteilung bewegen. Daher nehme ich an, dass es sich nach einer Einbrennperiode zur Zielverteilung bewegt.
Bei der Gibbs-Stichprobe akzeptieren wir jedoch alles. Wie kann man also sagen, dass es zur stationären / Zielverteilung konvergiert, auch wenn es uns an einen anderen Ort führt?
Angenommen , wir haben eine Verteilung . Wir können Z nicht berechnen. Im Metropolis-Algorithmus verwenden wir den Term , um die Verteilung plus die Normalisierungskonstante Z aufzunehmen. Also ist es gutc ( & thgr; n e w ) / c ( & thgr ; o l d ) c ( & thgr; )
Aber wo in Gibbs-Stichproben verwenden wir die Verteilung
Zum Beispiel in der Zeitung http://books.nips.cc/papers/files/nips25/NIPS2012_0921.pdf ist es gegeben
Wir haben also nicht die genaue bedingte Verteilung, aus der wir eine Stichprobe erstellen können, sondern nur etwas, das direkt proportional zur bedingten Verteilung ist
quelle
Antworten:
Wenn wir den Metropolis-Hastings-Algorithmus verwenden, müssen wir ein Akzeptanzverhältnis berechnen und die Zufallsvariable dann akzeptieren wir die Zufallsvariable, wenn .U∼Uniform (0,1)U<α
Bei der Gibbs-Stichprobe wird jedoch immer die Zufallsvariable ausgenommen, da wir das Akzeptanzverhältnis nicht berechnen müssen (nun ja, Sie tun es tatsächlich, aber wenn Sie Dinge anschließen, sehen Sie, dass alles abgebrochen wird und Ihr Akzeptanzverhältnis und so klar ist ist immer kleiner als und aus diesem Grund akzeptieren Sie immer). Sie können sich jedoch auch intuitiv vorstellen, wo Sie bei der Gibbs-Abtastung aus den vollständigen Bedingungen abtasten. Dies ist ein Ausdruck in geschlossener Form, aus dem wir direkt abtasten können, sodass es nicht erforderlich ist, Stichproben wie im Metropolis-Hastings-Algorithmus abzulehnen, in dem wir uns befinden Ich weiß nicht, wie ich aus probieren soll (oder erkenne normalerweise nicht die Form von . Ich hoffe, das hilft!U α p ( x )α=1 U α p(x)
quelle
Der Beweis, dass die Akzeptanzrate als Tippfehler gleich 1 ist, dh im Nenner im mittleren und dritten Teil sollte der Ausdruck für q z_i prime haben, so dass Sie am Ende P (z_i prime | z_i prime) erhalten.
Alex
quelle