Ist die Markov-Ketten-basierte Probenahme die „beste“ für die Monte-Carlo-Probenahme? Gibt es alternative Systeme?

9

Markov-Kette Monte Carlo ist eine auf Markov-Ketten basierende Methode, mit der wir Proben (in einer Monte-Carlo-Einstellung) aus nicht standardmäßigen Verteilungen erhalten können, aus denen wir keine Proben direkt ziehen können.

Meine Frage ist, warum die Markov-Kette für die Monte-Carlo-Probenahme "auf dem neuesten Stand" ist. Eine alternative Frage könnte sein, ob es andere Möglichkeiten wie Markov-Ketten gibt, die für die Monte-Carlo-Probenahme verwendet werden können. Ich weiß (zumindest aus der Literatur), dass das MCMC tiefe theoretische Wurzeln hat (in Bezug auf Bedingungen wie (a) Periodizität, Homogenität und detailliertes Gleichgewicht), frage mich aber, ob es für Monte "vergleichbare" probabilistische Modelle / Methoden gibt Carlo-Probenahme ähnlich wie bei Markov-Ketten.

Bitte leiten Sie mich, wenn ich einen Teil der Frage verwirrt habe (oder wenn es insgesamt verwirrend erscheint).

Ikram Ullah
quelle

Antworten:

11

Es gibt keinen Grund zu behaupten, dass MCMC-Sampling die "beste" Monte-Carlo-Methode ist! Normalerweise ist es auf der gegenüberliegenden schlechter als IId Probenahme, zumindest im Hinblick auf die Streuung der resultierenden Monte Carlo Schätzern der Tat, während dieser durchschnittlichen konvergiert gegen die Erwartung wenn die stationäre und begrenzende Verteilung der Markov-Kette , gibt es mindestens zwei Nachteile bei der Verwendung von MCMC-Methoden:

1T.t=1T.h(X.t)
E.π[h(X.)]]π(X.t)t
  1. Die Kette muss "Stationarität erreichen", was bedeutet, dass sie ihren Startwert vergessen muss . Mit anderen Worten, muss "groß genug" sein, damit von . Manchmal kann "groß genug" das Rechenbudget für das Experiment um mehrere Größenordnungen überschreiten.X.0tX.tπ
  2. Die Werte korreliert sind, zu einem asymptotischen Varianz führt , die beinhaltet das überschreitet im Allgemeinen und erfordert daher längere Simulationen als für eine iid-Stichprobe.X.t
    varπ(X.)+2t=1covπ(X.0,X.t)
    varπ(X.)

Vor diesem Hintergrund ist MCMC sehr nützlich für die Handhabung von Einstellungen, bei denen eine regelmäßige iid-Abtastung unmöglich oder zu kostspielig ist und bei denen die Wichtigkeit der Abtastung ziemlich schwierig zu kalibrieren ist, insbesondere aufgrund der Dimension der zu simulierenden Zufallsvariablen.

Sequentielle Monte-Carlo-Methoden wie Partikelfilter eignen sich jedoch möglicherweise besser für dynamische Modelle, bei denen die Daten durch Bursts stammen, die sofortige Aufmerksamkeit erfordern und nach kurzer Zeit sogar verschwinden (dh nicht gespeichert werden können).

Zusammenfassend ist MCMC ein sehr nützliches (und sehr häufig verwendetes) Tool, um komplexe Einstellungen zu handhaben, bei denen reguläre Monte-Carlo-Lösungen fehlschlagen.

Xi'an
quelle
8

Es gibt verschiedene Möglichkeiten, zufällige Werte aus einer Verteilung zu generieren. McMC ist eine davon, aber mehrere andere werden auch als Monte-Carlo-Methoden betrachtet (ohne den Markov-Kettenteil).

Die direkteste Methode für univariate Stichproben besteht darin, eine einheitliche Zufallsvariable zu generieren und diese dann in die inverse CDF-Funktion einzufügen. Dies funktioniert gut, wenn Sie die inverse CDF haben, ist jedoch problematisch, wenn die CDF und / oder ihre Inverse schwer direkt zu berechnen sind.

Bei multivariaten Problemen können Sie Daten aus einer Kopula generieren und dann die inverse CDF-Methode für die generierten Werte verwenden, um ein gewisses Maß an Korrelation zwischen Variablen zu erzielen (obwohl die Angabe der richtigen Parameter für die Kopula, um das gewünschte Korrelationsniveau zu erhalten, häufig etwas erfordert Versuch und Irrtum).

Die Ablehnungsabtastung ist ein weiterer Ansatz, mit dem Daten aus einer Verteilung (univariat oder multivariat) generiert werden können, bei der Sie die CDF oder ihre Umkehrung nicht kennen müssen (und nicht einmal die Normalisierungskonstante für die Dichtefunktion benötigen). Dies kann jedoch in einigen Fällen sehr ineffizient sein und viel Zeit in Anspruch nehmen.

Wenn Sie eher an Zusammenfassungen der generierten Daten als an den zufälligen Punkten selbst interessiert sind, ist die Wichtigkeitsstichprobe eine weitere Option.

Mit der Gibbs-Stichprobe, bei der es sich um eine Form der McMC-Stichprobe handelt, können Sie eine Stichprobe erstellen, bei der Sie die genaue Form der multivariaten Verteilung nicht kennen, solange Sie die bedingte Verteilung für jede Variable kennen, die den anderen gegeben ist.

Es gibt auch andere, was am besten davon abhängt, was Sie wissen und was nicht, und von anderen Details des spezifischen Problems. McMC ist beliebt, weil es in vielen Situationen gut funktioniert und sich auf viele verschiedene Fälle verallgemeinert.

Greg Snow
quelle