Konvergenzdiagnostik nach Gelman und Rubin, wie verallgemeinert man die Arbeit mit Vektoren?

14

Die Gelman- und Rubin-Diagnose wird verwendet, um die Konvergenz mehrerer mcmc-Ketten zu überprüfen, die parallel verlaufen. Es vergleicht die Varianz innerhalb der Kette mit der Varianz zwischen den Ketten, die Darstellung ist unten:

Schritte (für jeden Parameter):

  1. Lasse m ≥ 2 Ketten mit einer Länge von 2n von überdispersen Startwerten laufen.
  2. Wirf die ersten n Ziehungen in jeder Kette ab.
  3. Berechnen Sie die Varianz innerhalb der Kette und zwischen den Ketten.
  4. Berechnen Sie die geschätzte Varianz des Parameters als gewichtete Summe der Varianz innerhalb der Kette und zwischen den Ketten.
  5. Berechnen Sie den potenziellen Skalenreduzierungsfaktor.
  6. Listenpunkt

Ich möchte diese Statistik verwenden, aber die Variablen, mit denen ich sie verwenden möchte, sind Zufallsvektoren.

Ist es in diesem Fall sinnvoll, den Mittelwert der Kovarianzmatrizen zu nehmen?

Tim
quelle

Antworten:

17

Eine Empfehlung: Berechnen Sie die PSRF einfach separat für jede skalare Komponente

Der Originalartikel von Gelman & Rubin [1] sowie das Lehrbuch zur Bayesianischen Datenanalyse von Gelman et al. [2] empfiehlt, den potenziellen Skalenverringerungsfaktor (PSRF) für jeden interessierenden Skalarparameter separat zu berechnen. Um Konvergenz abzuleiten, müssen alle PSRFs nahe bei 1 liegen. Es spielt keine Rolle, dass Ihre Parameter als Zufallsvektoren interpretiert werden. Ihre Komponenten sind Skalare, für die Sie PSRFs berechnen können.

Brooks & Gelman [3] haben eine multivariate Erweiterung des PSRF vorgeschlagen, die ich im nächsten Abschnitt dieser Antwort überprüfe. Um jedoch Gelman & Shirley [4] zu zitieren:

[...] Diese Methoden können manchmal einen Overkill darstellen: Einzelne Parameter können gut geschätzt werden, während die ungefähre Konvergenz von Simulationen einer multivariaten Verteilung sehr lange dauern kann.

Alternative: multivariate Erweiterung von Brooks & Gelman

WB

V^=n1nW+1nB,
nV^,W
R^=maxaaTV^aaTWa=n1n+(m+1m)λ1,
mλ1W1V^/nλ10nR^

Verweise

[1] Gelman, Andrew und Donald B. Rubin. "Rückschluss aus iterativer Simulation mit mehreren Sequenzen." Statistical Science (1992): 457 & ndash; 472.

[2] Gelman, Andrew et al. Bayesianische Datenanalyse. CRC-Presse, 2013.

[3] Brooks, Stephen P. und Andrew Gelman. "Allgemeine Methoden zur Überwachung der Konvergenz von iterativen Simulationen." Journal of Computational and Graphical Statistics 7.4 (1998): 434 & ndash; 455.

[4] Gelman, Andrew und Kenneth Shirley. "Rückschluss aus Simulationen und Überwachung der Konvergenz". (Kapitel 6 in Brooks, Steve et al., Herausgeber Handbuch von Markov Chain Monte Carlo. CRC Press, 2011.)

Alle Artikel mit Ausnahme des Lehrbuchs [2] sind auf der Website von Andrew Gelman verfügbar .

Juho Kokkala
quelle