Ich untersuche eine Methode zur automatischen Überprüfung von Markov-Ketten-Monte-Carlo-Methoden und möchte einige Beispiele für Fehler nennen, die beim Erstellen oder Implementieren solcher Algorithmen auftreten können. Bonuspunkte, wenn die falsche Methode in einem veröffentlichten Artikel verwendet wurde.
Ich bin besonders an Fällen interessiert, in denen der Fehler bedeutet, dass die Kette die falsche invariante Verteilung hat, obwohl auch andere Arten von Fehlern (z. B. Kette nicht ergodisch) von Interesse wären.
Ein Beispiel für einen solchen Fehler wäre, keinen Wert auszugeben, wenn Metropolis-Hastings einen vorgeschlagenen Zug ablehnt.
Antworten:
1. Schätzer der Grenzwahrscheinlichkeit und des harmonischen Mittels
Die marginale Wahrscheinlichkeit ist definiert als die Normalisierungskonstante der posterioren Verteilung
Die Bedeutung dieser Größe ergibt sich aus der Rolle, die sie beim Modellvergleich über Bayes-Faktoren spielt .
Es wurden verschiedene Methoden vorgeschlagen, um diese Menge anzunähern. Raftery et al. (2007) schlagen den Harmonic Mean Estimator vor , der aufgrund seiner Einfachheit schnell populär wurde. Die Idee besteht darin, die Relation zu verwenden
Deshalb, wenn man eine Probe von der posterioren hat, sagen , kann diese Menge durch angenähert werden(θ1,...,θN)
Diese Annäherung steht im Zusammenhang mit dem Konzept der Stichprobenerhebung .
Nach dem Gesetz der großen Zahlen, wie es in Neals Blog diskutiert wird , ist dieser Schätzer konsistent . Das Problem ist, dass das für eine gute Approximation erforderliche sehr groß sein kann. In Neals Blog oder Roberts Blog 1 , 2 , 3 , 4 finden Sie einige Beispiele.N
Alternativen
Es gibt viele Alternativen zur Approximation von . Chopin und Robert (2008)stellen einige auf Stichproben basierende Methoden von Bedeutung vor.p(x)
2. Lassen Sie Ihren MCMC-Sampler nicht lange genug laufen (besonders bei Multimodalität)
Mendoza und Gutierrez-Peña (1999) leiten die Referenzprior / posterior für das Verhältnis zweier normaler Mittelwerte her und präsentieren ein Beispiel für die mit diesem Modell erhaltenen Schlussfolgerungen unter Verwendung eines realen Datensatzes. Unter Verwendung von MCMC-Methoden erhalten sie eine Stichprobe der Größe des posterioren Verhältnisses der Mittelwerte2000 das unten gezeigt istφ
3. In dieser Diskussion von Gelman, Carlin und Neal finden sich einige andere Punkte wie die Beurteilung der Konvergenz, die Wahl der Ausgangswerte und das schlechte Verhalten der Kette .
4. Wichtigkeitsprobe
Ein Verfahren zur Approximation eines Integrals besteht darin, den Integranden mit einer Dichte multipliziereng , mit der gleichen Unterstützung, die wir simulieren können
quelle
Darren Wilkinson gibt in seinem Blog ein detailliertes Beispiel für einen häufigen Fehler in Metropolis-Hastings. Ich empfehle es vollständig zu lesen, aber hier ist die tl; dr-Version.
Wenn die Zielverteilung in einer Dimension positiv ist (wie Gamma-Verteilungen usw. ), ist es verlockend, Vorschläge mit einem negativen Wert für diese Dimension sofort abzulehnen. Der Fehler besteht darin, die Vorschläge, wie sie noch nie gemacht wurden, wegzuwerfen und nur die Metropolis-Hastings-Akzeptanzquote der anderen zu bewerten. Dies ist ein Fehler, da es sich um die Verwendung einer nicht symmetrischen Angebotsdichte handelt.
Der Autor schlägt vor, eine von zwei Korrekturen anzuwenden.
Zählen Sie die "Negative" als fehlgeschlagene Akzeptanz (und verlieren Sie ein wenig an Effizienz).
Verwenden Sie in diesem Fall das richtige MH-Verhältnis
woherπ ist die Zieldichte und Φ ist die Normalisierungskonstante des abgeschnittenen Zufallsvorschlags ϕ , dh Φ ( x ) = ∫∞0ϕ ( y- x ) dy .
quelle
Ein sehr klarer Fall (in Verbindung mit der in der ersten Antwort erwähnten Grenzwahrscheinlichkeitsannäherung ), in dem echte Konvergenz das Problem des Etikettenwechsels in Mischungsmodellen in Verbindung mit der Verwendung des Schätzers von Chib (1995) darstellt . Wie von Radford Neal (1999) ausgeführt, erreicht die Monte-Carlo-Näherung von Chib nicht den richtigen numerischen Wert , wenn die MCMC-Kette in dem Sinne nicht richtig konvergiert, dass sie einen Teil des Modus der Zielverteilung untersucht.
quelle