Was sind prädiktive Nachkontrollen und was macht sie nützlich?

33

Ich verstehe die posteriore Vorhersageverteilung und habe über posteriore Vorhersageprüfungen gelesen , obwohl mir noch nicht klar ist, was sie bewirkt.

  1. Was genau ist der hintere prädiktive Check?
  2. Warum sagen manche Autoren, dass die Durchführung von Vorhersagetests im Nachhinein "die Daten zweimal verwenden" und nicht missbraucht werden sollten? (oder sogar, dass es nicht Bayesianisch ist)? (zB siehe dies oder das )
  3. Wofür ist dieser Check genau nützlich? Kann es wirklich zur Modellauswahl herangezogen werden? (Berücksichtigt es z. B. sowohl die Fitness als auch die Modellkomplexität?)
Amelio Vazquez-Reina
quelle

Antworten:

36

Posterior Predictive Checks sind mit einfachen Worten "das Simulieren replizierter Daten unter dem angepassten Modell und das anschließende Vergleichen dieser mit den beobachteten Daten" ( Gelman und Hill, 2007, S. 158 ). Sie verwenden also posterior predictive, um "nach systematischen Diskrepanzen zwischen realen und simulierten Daten zu suchen" ( Gelman et al. 2004, S. 169 ).

Das Argument für "zweimaliges Verwenden der Daten" besteht darin, dass Sie Ihre Daten zur Schätzung des Modells und dann zur Überprüfung der Übereinstimmung des Modells mit den Daten verwenden. Im Allgemeinen ist dies jedoch eine schlechte Idee und es ist besser, Ihr Modell anhand externer Daten zu validieren , das wurde nicht zur Schätzung herangezogen.

Posterior Predictive Checks sind hilfreich bei der Beurteilung, ob Ihr Modell "gültige" Vorhersagen über die Realität liefert - ob sie zu den beobachteten Daten passen oder nicht. Es ist eine hilfreiche Phase des Modellbaus und der Überprüfung. Es gibt Ihnen keine definitive Antwort darauf, ob Ihr Modell "in Ordnung" oder "besser" ist als andere Modelle. Es kann Ihnen jedoch dabei helfen, zu überprüfen, ob Ihr Modell sinnvoll ist.

Dies ist in LaplacesDemon Vignette Bayesian Inference gut beschrieben :

yrepy

Posterior Predictive Checks (über die Predictive Distribution) beinhalten eine doppelte Verwendung der Daten, was gegen das Likelihood-Prinzip verstößt. Es wurden jedoch Argumente für posteriore prädiktive Überprüfungen vorgebracht, vorausgesetzt, die Verwendung beschränkt sich auf Diskrepanzmaße bei der Untersuchung der Modelladäquanz und nicht auf Modellvergleich und Inferenz (Meng 1994).

yrepyyyrep

Tim
quelle
3
Abgesehen davon, dass es sich bei PPCs möglicherweise nicht um Bayes handelt, wird von Gelman viel darüber gesprochen, was genau eine Bayesian / Bayesian-Datenanalyse für Gelman und Shalizi
N Brouwer,
2
Gelman & Shalizi diskutieren, was Bayesianische Datenanalyse aus ihrer Sicht ist. Es gibt da draußen viele unterschiedliche Sichtweisen , die alle gut motiviert - von Jeffreys zu Savage, von de Finetti zu Gaifman, Scott & Krauss & Hailperin , nicht Ansichten zu erwähnen noch unterscheiden, wie Dempster-Shafer .
pglpm 30.09.17