Das Umschalten von Markierungen (dh die posteriore Verteilung ist gegenüber dem Umschalten von Komponentenkennzeichnungen invariant) ist ein problematisches Problem, wenn MCMC zum Schätzen von Mischungsmodellen verwendet wird.
Gibt es eine Standardmethode (wie allgemein anerkannt), um mit dem Problem umzugehen?
Wenn es keinen Standardansatz gibt, welche Vor- und Nachteile haben dann die führenden Ansätze, um das Problem des Etikettenwechsels zu lösen?
Antworten:
Es gibt eine nette und relativ neue Diskussion über dieses Problem hier:
Grundsätzlich gibt es mehrere Standardstrategien, von denen jede Vor- und Nachteile hat. Am naheliegendsten ist es, den Prior so zu formulieren, dass sichergestellt ist, dass nur ein posteriorer Modus vorliegt (z. B. Reihenfolge der Mittel der Mischungsbestandteile). Dies hat jedoch einen merkwürdigen Effekt auf den posterioren und wird daher nicht allgemein verwendet. Als Nächstes ignorieren Sie das Problem während der Stichprobenerfassung und verarbeiten die Ausgabe nach, um die Komponenten neu zu kennzeichnen, damit die Beschriftungen konsistent bleiben. Dies ist einfach zu implementieren und scheint in Ordnung zu funktionieren. Die ausgefeilteren Ansätze kennzeichnen sich online neu, indem sie entweder einen einzelnen Modus beibehalten oder die Etiketten absichtlich zufällig durchlaufen, um das Mischen über mehrere Modi sicherzustellen. Ich mag den letzteren Ansatz sehr, aber dies lässt immer noch das Problem offen, wie die Ausgabe sinnvoll zusammengefasst werden kann. Ich sehe das jedoch als separates Problem.
quelle
Gilles Celeux beschäftigte sich auch mit dem Problem des Etikettenwechsels, z
Ergänzend zu @ darrenjws guter Antwort finden Sie hier zwei Online-Artikel, in denen alternative Strategien besprochen wurden:
quelle