MCMC-Methoden - Proben brennen?

12

Bei MCMC- Methoden lese ich immer wieder über die burn-inZeit oder die Anzahl der Proben "burn". Was ist das genau und warum wird es benötigt?

Aktualisieren:

Bleibt MCMC stabil, sobald es sich stabilisiert hat? Wie hängt der Zeitbegriff burn-inmit dem der Mischzeit zusammen?

Amelio Vazquez-Reina
quelle
1
Der Ausdruck " Einbrennen " bedeutet nicht "Verbrennen" der Proben, sondern lässt das System zufriedenstellend aus seinem "neuen" Zustand in einen Zustand übergehen, in dem es für die Verwendung geeignet ist. (Die Proben werden während des Einschwingens verworfen, ja, aber der Ausdruck bedeutet nicht "Brennen" in diesem Sinne. Es ist näher daran, den Motor aufzuwärmen, bevor er auf die Straße gebracht wird.) In dieser Antwort finden Sie eine Diskussion über wofür es ist.
Glen_b -Rate State Monica
(Insbesondere der erste Absatz dieser Antwort)
Glen_b -State Monica
1
@Glen_b, ich denke, ich wusste das, aber ich mag das mentale Bild der zweifelhaften Proben, die in Rauch aufgehen ...
Matt Krause

Antworten:

17

n

Die Idee ist, dass ein "schlechter" Startpunkt Regionen übertasten kann, bei denen die Wahrscheinlichkeit unter der Gleichgewichtsverteilung tatsächlich sehr gering ist, bevor er sich in der Gleichgewichtsverteilung einstellt. Wenn Sie diese Punkte wegwerfen, sind die Punkte, die unwahrscheinlich sein sollten, angemessen selten.

Diese Seite gibt ein schönes Beispiel, weist aber auch darauf hin, dass das Einbrennen eher ein Hack / eine Kunstform als eine prinzipielle Technik ist. Theoretisch könnte man einfach eine sehr lange Zeit probieren oder einen Weg finden, stattdessen einen anständigen Ausgangspunkt zu wählen.

Bearbeiten: Die Mischzeit bezieht sich darauf, wie lange es dauert, bis sich die Kette ihrem stationären Zustand nähert, aber es ist oft schwierig, sie direkt zu berechnen. Wenn Sie die Mischzeit kennen würden, würden Sie nur so viele Samples verwerfen, in vielen Fällen jedoch nicht. Daher wählen Sie stattdessen eine Einbrennzeit, die hoffentlich groß genug ist.

Was die Stabilität betrifft, kommt es darauf an. Wenn Ihre Kette konvergiert hat, dann ... ist sie konvergiert. Es gibt jedoch auch Situationen, in denen die Kette konvergiert zu sein scheint , aber tatsächlich nur in einem Teil des Zustandsraums "rumhängt". Stellen Sie sich zum Beispiel vor, dass es mehrere Modi gibt, aber jeder Modus schlecht mit den anderen verbunden ist. Es kann sehr lange dauern, bis der Sampler diese Lücke überwunden hat, und es sieht so aus, als ob die Kette bis zu diesem Sprung konvergiert.

Es gibt Diagnosen für Konvergenz, aber vielen von ihnen fällt es schwer, echte Konvergenz und Pseudokonvergenz auseinander zu halten. Charles Geyers Kapitel (Nr. 1) im Handbuch der Markov-Kette Monte Carlo ist ziemlich pessimistisch in Bezug auf alles, außer die Kette so lange wie möglich laufen zu lassen.

Matt Krause
quelle
Vielen Dank. Ich habe dem OP ein kleines Update hinzugefügt, um das Konzept weiter zu klären.
Amelio Vazquez-Reina
Ich fügte ein bisschen mehr hinzu; Ich hoffe, das hilft.
Matt Krause
6

Der Metropolis-Hastings-Algorithmus wählt zufällig Stichproben aus der posterioren Verteilung aus. In der Regel sind Erstproben nicht vollständig gültig, da sich die Markov-Kette nicht auf die stationäre Verteilung stabilisiert hat. Durch das Einbrennen von Proben können Sie diese ersten Proben verwerfen, die sich noch nicht im Stillstand befinden.

Eric Peterson
quelle
1
Danke - Bleibt die Markov-Kette stabil, sobald sie sich stabilisiert hat? Wie hängt das mit dem Begriff der Mischzeit zusammen? Ist es das Gleiche?
Amelio Vazquez-Reina