Ich verstehe den Algorithmus wie folgt:
No U-Turn Sampler (NUTS) ist eine Hamilton-Monte-Carlo-Methode. Dies bedeutet, dass es sich nicht um eine Markov-Kettenmethode handelt und dieser Algorithmus daher den Random-Walk-Teil vermeidet, der häufig als ineffizient und langsam konvergierend angesehen wird.
Anstatt den Zufallsrundgang zu machen, macht NUTS Sprünge der Länge x. Jeder Sprung verdoppelt sich, wenn der Algorithmus weiterläuft. Dies geschieht, bis die Flugbahn einen Punkt erreicht, an dem sie zum Startpunkt zurückkehren möchte.
Meine Fragen: Was ist das Besondere an der Kehrtwende? Wie überspringt das Verdoppeln der Flugbahn nicht den optimierten Punkt? Ist meine obige Beschreibung korrekt?
bayesian
monte-carlo
markov-process
user3007270
quelle
quelle
Antworten:
Das No-U-Turn-Bit gibt an, wie Vorschläge generiert werden. Die HMC generiert ein hypothetisches physikalisches System: Stellen Sie sich einen Ball mit einer bestimmten kinetischen Energie vor, der durch eine Landschaft mit Tälern und Hügeln (die Analogie zerfällt in mehr als zwei Dimensionen) rollt, die von dem Posterior definiert wird, von dem Sie eine Abtastung durchführen möchten. Jedes Mal, wenn Sie eine neue MCMC-Probe entnehmen möchten, wählen Sie nach dem Zufallsprinzip die kinetische Energie aus und beginnen den Ball von Ihrem Standort aus zu rollen. Sie simulieren in diskreten Zeitschritten und um sicherzustellen, dass Sie den Parameterraum richtig erkunden, simulieren Sie Schritte in eine Richtung und die doppelt so vielen in die andere Richtung, drehen Sie sich erneut um usw. Irgendwann möchten Sie dies und einen guten Weg anhalten Dies ist der Fall, wenn Sie eine Kehrtwende gemacht haben (dh anscheinend überall verschwunden sind).
Zu diesem Zeitpunkt wird der vorgeschlagene nächste Schritt Ihrer Markov-Kette (mit bestimmten Einschränkungen) aus den von Ihnen besuchten Punkten ausgewählt. Das heißt, die gesamte Simulation des hypothetischen physikalischen Systems war "nur", um einen Vorschlag zu erhalten, der dann akzeptiert (die nächste MCMC-Stichprobe ist der vorgeschlagene Punkt) oder abgelehnt (die nächste MCMC-Stichprobe ist der Ausgangspunkt) wird.
Das Schlaue daran ist, dass die Vorschläge auf der Form des Seitenzahns basieren und sich am anderen Ende der Verteilung befinden können. Im Gegensatz dazu macht Metropolis-Hastings Vorschläge innerhalb einer (möglicherweise verzerrten) Kugel. Gibbs-Abtastung bewegt sich jeweils nur entlang einer (oder zumindest sehr weniger) Dimensionen.
quelle
Sie sind falsch, dass HMC keine Markov-Kettenmethode ist. Per Wikipedia :
Lesen Sie für mehr Klarheit das arXiv-Dokument von Betancourt , in dem die NUTS-Abschlusskriterien aufgeführt sind:
In Anhang A.3 geht es um so etwas wie die von Ihnen erwähnte Verdoppelung der Flugbahn:
und erweitert dies in A.4, wo es um eine dynamische Implementierung geht (Abschnitt A.3 befasst sich mit einer statischen Implementierung):
Ich denke, der Schlüssel ist, dass es nicht so viele Sprünge macht, sondern seinen nächsten Sprung mit einer Technik berechnet, die die vorgeschlagene Sprunglänge verdoppelt, bis ein Kriterium erfüllt ist. Zumindest verstehe ich das Papier so.
quelle