Wie wird in MCMC die Einbrennzeit gewählt?

8

Wie wird in MCMC die Einbrennzeit gewählt? Mit anderen Worten, wie lange müssen Sie warten, bis Sie glauben, dass die Markov-Kette ihre Grenzverteilung erreicht hat? Vielen Dank!

Tim
quelle

Antworten:

6

Es gibt verschiedene Diagnosen, darunter die Geweke-Diagnose, die Heidelberg- und Welch-Diagnose, die Raftery- und Lewis-Diagnose sowie die Gelman- und Rubin-Mehrfachsequenzdiagnose. Auch eine visuelle Untersuchung des Trace-Plots kann hilfreich sein. All dies sind nur Hinweise, keine Garantien.

Sie könnten auschecken:

http://www.people.fas.harvard.edu/~plam/teaching/methods/convergence/convergence_print.pdf oder

http://www.stat.duke.edu/courses/Fall10/sta290/Lectures/Diagnostics/param-diag.pdf

BEARBEITEN: Außerdem können Sie die Einbrennlänge nicht im Voraus bestimmen. Sie sehen sich Ihren Lauf an - wie oben vorgeschlagen - und wenn es so aussieht, als wären die Dinge am Ende Ihres Einbrennens zusammengewachsen, ist das Einbrennen, das Sie durchgeführt haben, lang genug.

Wayne
quelle
1
Diese Diagnosen sagen Ihnen nicht, was Sie wirklich wissen wollen. Sie sagen, wenn die Kette konvergiert, wird die Diagnose wahrscheinlich sagen, dass sie konvergiert, aber sie sagen nicht, dass wenn die Kette pseudokonvergiert, die Diagnose wahrscheinlich sagt, dass die Kette nicht konvergiert. Diejenigen, die behaupten, Pseudokonvergenz zuverlässig zu diagnostizieren, haben nicht überprüfbare Bedingungen, die sie unbrauchbar machen.
Glen
Wie gesagt, sie sind nur Indikatoren, keine Garantien. Ich sehe eigentlich keine Möglichkeit, Pseudokonvergenz tatsächlich zu diagnostizieren. Um das zu tun, müssten Sie die wahre Verteilung bereits kennen, aber warum dann MCMC?
Wayne
1
Richtig, wollte nur diesen Punkt betonen.
Glen
4

Ich würde die MCMC viele Male ausführen (mit unterschiedlichen Startwerten) und die Log-Wahrscheinlichkeit zusammen mit Parameterschätzungen über die Zeit (oder die Iterationsnummer) zeichnen. Hoffentlich sehen Sie einen Trend für die Iterationsnummer, mit der die Kette in die stationäre Verteilung eingeht. Ich würde dann diesen Wert (und etwas mehr hinzufügen, um konservativ zu sein) als Einbrennzeit verwenden.

Natürlich gibt es keine Garantie dafür, dass dies in allen Szenarien funktioniert oder dass Sie in Ihren Simulationen die tatsächlichen stationären Verteilungen eingegeben haben. Daher sollte dieser Rat mit einem Körnchen Salz genommen werden.

Tal
quelle