Warum bezieht der Bayes'sche p-Wert zusätzlich zu den Daten die Parameter ein?

7

Auf Seite 146 der Bayes'schen Datenanalyse von Gelman erläutert Gelman den Bayes'schen p-Wert, um die Anpassung des Modells zu überprüfen. Die Idee ist, die beobachteten Daten ( ) mit Daten zu vergleichen, die vom Modell generiert werden könnten, wenn wir das Experiment replizieren ( ).yyrep

Er definiert den Bayes'schen p-Wert als

pB.=P.r(T.(yrep,θ)T.(y,θ)|y)

Ich verstehe nicht ganz, warum es sinnvoll ist, dass die Teststatistik eine Funktion der Parameter . Wenn das Ziel darin besteht, "die beobachteten Daten mit Daten zu vergleichen, die vom Modell generiert werden könnten ", sollte der Vergleich dann nicht streng zwischen und ?θyyrep

Auf derselben Seite bietet Gelman beispielsweise ein Beispiel, in dem er die Passform eines normalen Modells überprüft. Die Teststatistik lautet:

T.(y,θ)=|y(61)- -θ|- -|y(6)- -θ|

Dabei ist der Mittelwert des normalen Modells. Diese Teststatistik wurde entwickelt, um die Modellanpassung am äußersten Ende über die Statistik 6. und 61. Ordnung hinaus zu ignorieren.θ

Warum verwenden wir nicht stattdessen die folgende Teststatistik, die sich ausschließlich auf die Daten stützt?

T.(y,θ)=|y(61)- -y¯|- -|y(6)- -y¯|
Heisenberg
quelle

Antworten:

0

Nichts hindert Sie daran, Teststatistiken zu verwenden, die ausschließlich auf den Replikationsdaten basieren.

Der Punkt im Beispiel ist, dass das Modell annimmt yich ist normalerweise um einen Mittelwert verteilt θ nicht in der Nähe y¯. Die in Gelman et. al. testet etwas über die Normalitätsannahme, während es nicht wirklich klar ist, was Ihre Teststatistik testet.

jaradniemi
quelle
3
Ich bin damit einverstanden, dass es 100% koscher ist, Teststatistiken ausschließlich auf der Grundlage der Replikationsdaten zu verwenden. Die Frage ist, warum es koscher ist, Teststatistiken zu verwenden, die die Modellparameter beinhalten. Konzeptionell ist es sinnvoll, dass wir das Modell verwenden, um einige Vorhersagen zu treffen, und diese Vorhersagen dann mit der beobachteten "Grundwahrheit" vergleichen.T.(y). Es macht keinen Sinn, dass der Vergleich gegen gemacht werden kannT.(y,θ), was beinhaltet θ, das von dem Modell stammt, das wir zuerst überprüfen möchten. Es scheint mir kreisförmig.
Heisenberg