Gibt es eine Standardmethode zur Behandlung des Problems des Etikettenwechsels bei der MCMC-Schätzung von Gemischmodellen?

15

Das Umschalten von Markierungen (dh die posteriore Verteilung ist gegenüber dem Umschalten von Komponentenkennzeichnungen invariant) ist ein problematisches Problem, wenn MCMC zum Schätzen von Mischungsmodellen verwendet wird.

  1. Gibt es eine Standardmethode (wie allgemein anerkannt), um mit dem Problem umzugehen?

  2. Wenn es keinen Standardansatz gibt, welche Vor- und Nachteile haben dann die führenden Ansätze, um das Problem des Etikettenwechsels zu lösen?

whuber
quelle
Ich überlegte, ob ich fragen soll: "Wie kann ich ein MCMC-Modell der Ausgabe auf lmer für Modelle mit zufälligen Steigungen erstellen?" aber ich frage mich, ob diese Frage mit dieser Frage überflüssig ist. Das heißt, ist das "Label-Switching-Problem" bei der Verwendung von MCMC zur Schätzung von Mischmodellen dasselbe Problem, mit dem pvals.fnc () in languageR Modelle abfangen kann, jedoch keine Modelle mit Steigungen? Wenn nicht, lassen Sie es mich bitte wissen und ich werde wieder meine ursprüngliche Frage stellen.
Russellpierce
@drknexus Ich weiß nicht, R in Ihrer Frage zu kommentieren. Vielleicht solltest du deine Frage einfach mit einem Kommentar posten, damit deine Frage mit dieser Frage in Verbindung gebracht wird.

Antworten:

14

Es gibt eine nette und relativ neue Diskussion über dieses Problem hier:

Christian P. Robert Multimodalität und Labelwechsel: eine Diskussion. Workshop zu Mischungen, ICMS 3. März 2010.

Grundsätzlich gibt es mehrere Standardstrategien, von denen jede Vor- und Nachteile hat. Am naheliegendsten ist es, den Prior so zu formulieren, dass sichergestellt ist, dass nur ein posteriorer Modus vorliegt (z. B. Reihenfolge der Mittel der Mischungsbestandteile). Dies hat jedoch einen merkwürdigen Effekt auf den posterioren und wird daher nicht allgemein verwendet. Als Nächstes ignorieren Sie das Problem während der Stichprobenerfassung und verarbeiten die Ausgabe nach, um die Komponenten neu zu kennzeichnen, damit die Beschriftungen konsistent bleiben. Dies ist einfach zu implementieren und scheint in Ordnung zu funktionieren. Die ausgefeilteren Ansätze kennzeichnen sich online neu, indem sie entweder einen einzelnen Modus beibehalten oder die Etiketten absichtlich zufällig durchlaufen, um das Mischen über mehrere Modi sicherzustellen. Ich mag den letzteren Ansatz sehr, aber dies lässt immer noch das Problem offen, wie die Ausgabe sinnvoll zusammengefasst werden kann. Ich sehe das jedoch als separates Problem.

Darren Wilkinson
quelle
1
scheint die Verbindung unterbrochen zu sein
Edgar Santos
Ich habe den Link behoben, indem ich ihn auf web.archive.org gefunden und einen Link zu einer Kopie dieser Folien bereitgestellt habe, die vom Autor auf SlideShare gehostet wurden.
Tim
9

Gilles Celeux beschäftigte sich auch mit dem Problem des Etikettenwechsels, z

G. Celeux, Bayes'sche Folgerung für Mischung: das Problem des Labelwechsels. Proceedings Compstat 98 , S. 227-232, Physica-Verlag (1998).

Ergänzend zu @ darrenjws guter Antwort finden Sie hier zwei Online-Artikel, in denen alternative Strategien besprochen wurden:

  1. Jasra et al., Markov-Ketten-Monte-Carlo-Methoden und das Label-Switching-Problem bei der Bayes'schen Mischungsmodellierung
  2. Sperrin et al., Probabilistische Relabelling-Strategien für das Label-Switching-Problem in Bayes-Mischungsmodellen
chl
quelle