Bei MCMC- Methoden lese ich immer wieder über die burn-in
Zeit oder die Anzahl der Proben "burn"
. Was ist das genau und warum wird es benötigt?
Aktualisieren:
Bleibt MCMC stabil, sobald es sich stabilisiert hat? Wie hängt der Zeitbegriff burn-in
mit dem der Mischzeit zusammen?
Antworten:
Die Idee ist, dass ein "schlechter" Startpunkt Regionen übertasten kann, bei denen die Wahrscheinlichkeit unter der Gleichgewichtsverteilung tatsächlich sehr gering ist, bevor er sich in der Gleichgewichtsverteilung einstellt. Wenn Sie diese Punkte wegwerfen, sind die Punkte, die unwahrscheinlich sein sollten, angemessen selten.
Diese Seite gibt ein schönes Beispiel, weist aber auch darauf hin, dass das Einbrennen eher ein Hack / eine Kunstform als eine prinzipielle Technik ist. Theoretisch könnte man einfach eine sehr lange Zeit probieren oder einen Weg finden, stattdessen einen anständigen Ausgangspunkt zu wählen.
Bearbeiten: Die Mischzeit bezieht sich darauf, wie lange es dauert, bis sich die Kette ihrem stationären Zustand nähert, aber es ist oft schwierig, sie direkt zu berechnen. Wenn Sie die Mischzeit kennen würden, würden Sie nur so viele Samples verwerfen, in vielen Fällen jedoch nicht. Daher wählen Sie stattdessen eine Einbrennzeit, die hoffentlich groß genug ist.
Was die Stabilität betrifft, kommt es darauf an. Wenn Ihre Kette konvergiert hat, dann ... ist sie konvergiert. Es gibt jedoch auch Situationen, in denen die Kette konvergiert zu sein scheint , aber tatsächlich nur in einem Teil des Zustandsraums "rumhängt". Stellen Sie sich zum Beispiel vor, dass es mehrere Modi gibt, aber jeder Modus schlecht mit den anderen verbunden ist. Es kann sehr lange dauern, bis der Sampler diese Lücke überwunden hat, und es sieht so aus, als ob die Kette bis zu diesem Sprung konvergiert.
Es gibt Diagnosen für Konvergenz, aber vielen von ihnen fällt es schwer, echte Konvergenz und Pseudokonvergenz auseinander zu halten. Charles Geyers Kapitel (Nr. 1) im Handbuch der Markov-Kette Monte Carlo ist ziemlich pessimistisch in Bezug auf alles, außer die Kette so lange wie möglich laufen zu lassen.
quelle
Der Metropolis-Hastings-Algorithmus wählt zufällig Stichproben aus der posterioren Verteilung aus. In der Regel sind Erstproben nicht vollständig gültig, da sich die Markov-Kette nicht auf die stationäre Verteilung stabilisiert hat. Durch das Einbrennen von Proben können Sie diese ersten Proben verwerfen, die sich noch nicht im Stillstand befinden.
quelle