Hyperprior-Dichte für hierarchisches Gamma-Poisson-Modell

11

In einem hierarchischen Datenmodell y in dem

yPoisson(λ)
λGamma(α,β)
, scheint es in der Praxis typisch zu sein, Werte ( α,β) so zu dass der Mittelwert und die Varianz von Die Gammaverteilung stimmt ungefähr mit dem Mittelwert und der Varianz der Daten überein y(z. B. Clayton und Kaldor, 1987 "Empirical Bayes Estimates of Age-Standardized Relative Risks for Disease Mapping", Biometrics ). Dies ist jedoch eindeutig nur eine Ad-hoc- Lösung, da dies das Vertrauen des Forschers in die Parameter (α,β) und kleine Schwankungen der realisierten Daten können große Konsequenzen für die Gammadichte haben,selbst wennder zugrunde liegende Datenerzeugungsprozess derselbe bleibt.

Darüber hinaus schreibt Gelman in der Bayesian Data Analysis (2. Aufl.), Dass diese Methode " schlampig " ist ; In dem Buch und diesem Artikel (ab S. 3232) schlägt er stattdessen vor, eine Hyperpriorendichte p(α,β) zu wählen, ähnlich wie im Beispiel für Rattentumoren (ab S. 130).

Obwohl es klar ist, dass jedes p(α,β) zulässig ist, solange es eine endliche hintere Dichte erzeugt, habe ich keine Beispiele für hyperpriore Dichten gefunden, die Forscher in der Vergangenheit für dieses Problem verwendet haben. Ich würde es sehr begrüßen, wenn mich jemand auf Bücher oder Artikel verweisen könnte, die eine Hyperprior-Dichte zur Schätzung eines Poisson-Gamma-Modells verwendet haben. Idealerweise interessiere ich mich für p(α,β) , das relativ flach ist und von den Daten wie im Rattentumorbeispiel dominiert wird, oder von einer Diskussion, in der mehrere alternative Spezifikationen und die damit verbundenen Kompromisse verglichen werden.

Sycorax sagt Reinstate Monica
quelle

Antworten:

5

Ich beantworte die Frage nicht wirklich, da ich Sie nicht auf Bücher oder Artikel verweise, in denen ein Hyperprior verwendet wurde, sondern stattdessen Dinge über Priors zu Gamma-Parametern beschreibe und mit ihnen verknüpfe.

Beachten Sie zunächst, dass das Poisson-Gamma-Modell bei Integration von zu einer negativen Binomialverteilung mit den Parametern α und β / ( 1 + β ) führt . Der zweite Parameter liegt im Bereich ( 0 , 1 ) . Wenn Sie nicht informativ sein möchten, kann ein Jeffreys vor p = β / ( 1 + β ) angebracht sein. Sie können den Prior direkt auf p setzen oder die Änderung der Variablen durcharbeiten, um Folgendes zu erhalten:λαβ/(1+β)(0,1)p=β/(1+β)p

p(β)β1/2(1+β)1

Alternativ können Sie beachten Sie, dass der Skalenparameter für die Gamma - Verteilung ist, und, allgemein, die Jeffreys sich vor Antritt einer Skala Parameter β heißt 1 / β . Man könnte es seltsam finden, dass der Jeffreys-Prior für β zwischen den beiden Modellen unterschiedlich ist, aber die Modelle selbst sind nicht gleichwertig; eine ist für die Verteilung von y | α , β und das andere ist für die Verteilung von λ | α , β . Ein Argument für das erstere ist, dass die Daten unter der Annahme, dass keine Clusterbildung vorliegt, tatsächlich im negativen Binomial ( α , pββ1/ββy|α,βλ|α,β , alsoist es das Richtige, die Priors direkt auf α und p zu setzen. OTOH: Wenn Sie beispielsweise Cluster in den Daten haben, in denen die Beobachtungen in jedem Cluster das gleiche λ haben , müssen Sie die λ swirklichirgendwiemodellieren, und dahererscheint es angemessener, β als Skalierungsparameter einer Gamma-Verteilung zubehandeln. (Meine Gedanken zu einem möglicherweise umstrittenen Thema.)(α,p)αpλλβ

Der erste Parameter kann auch über Jeffreys Priors angesprochen werden. Wenn wir die übliche Technik verwenden, Jeffreys-Priors für jeden Parameter unabhängig zu entwickeln und dann das Gelenk (Nicht-Jeffreys) vor als Produkt der beiden Einzelparameter-Priors zu bilden, erhalten wir einen Prior für den Formparameter einer Gamma-Verteilung:α

p(α)PG(1,α)

wo die Polygammafunktion . Umständlich, aber verkürzbar. Sie können dies mit einem der oben genannten Jeffreys-Prioritäten kombinieren, um eine nicht informative gemeinsame vorherige Verteilung zu erhalten. Kombiniere es mit dem 1 / βPG(1,α)=i=0(i+α)21/β Prior für den Gamma-Skalenparameter führt zu einem Referenzprior für die Gamma-Parameter.

Wenn wir die Route von Full Jeffreys gehen und die wahren Jeffreys vor den Gamma-Parametern bilden möchten, erhalten wir:

p(α,β)αPG(1,α)1/β

Jeffreys Prioritäten für mehrdimensionale Parameter weisen jedoch häufig schlechte Eigenschaften sowie schlechte Konvergenzeigenschaften auf (siehe Link zur Vorlesung ). Ich weiß nicht, ob dies beim Gamma der Fall ist, aber das Testen würde einige nützliche Informationen liefern.

Weitere Informationen zu Prioritäten für das Gamma finden Sie auf Seite 13-14 des Katalogs der nicht informativen Prioritäten , Yang und Berger. Es gibt auch viele andere Distributionen. Für einen Überblick über Jeffreys und Referenzprioren finden Sie hier einige Vorlesungsunterlagen .

jbowman
quelle
Vielen Dank für die sehr ausführliche Antwort. Ich werde ein paar Stunden brauchen, um die unterstützenden Materialien vollständig zu lesen und den Inhalt des Beitrags allgemein zu verdauen. Bitte verwechseln Sie mein langsames Tempo nicht mit mangelnder Dankbarkeit.
Sycorax sagt Reinstate Monica