Hierarchische Bayes'sche Modellierung von Inzidenzraten

8

Kevin Murphys Buch behandelt ein klassisches hierarchisches Bayes'sches Problem (ursprünglich diskutiert in Johnson and Albert, 1999, p24):

Angenommen, wir versuchen, die Krebsrate in Städten zu schätzen . In jeder Stadt untersuchen wir eine Anzahl von Personen und messen die Anzahl der Personen mit Krebs , wobei die wahre Krebsrate in der Stadt ist.N i x iBin ( N i , θ i ) θ iNNixiBin(Ni,θi)θi

Wir möchten die 's schätzen und gleichzeitig den Städten ermöglichen, statistische Stärke von datenreichen Städten zu leihen.θi

Zu diesem modelliert er so, dass alle Städte denselben Prior haben, sodass die endgültigen Modelle wie folgt aussehen:θiBeta(a,b)

p(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)

wobei .η=(a,b)

Der entscheidende Teil dieses Modells ist natürlich (ich zitiere), "dass wir aus den Daten ableiten , denn wenn wir es nur auf eine Konstante klemmen, wird das bedingt unabhängig sein und dort wird kein Informationsfluss zwischen ihnen sein ".θ iη=(a,b)θi


Ich versuche dies in PyMC zu modellieren , aber soweit ich verstehe, brauche ich einen Prior für und (ich glaube, das ist oben). Was wäre ein guter Vorgänger für dieses Modell?b p ( η )abp(η)

Falls es hilft, lautet der Code, wie ich ihn jetzt habe:

bins = dict()
ps   = dict()
for i in range(N_cities):
    ps[i]   = pm.Beta("p_{}".format(i), alpha=a, beta=b)
    bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i],  value=N_yes[i], observed=True)

mcmc = pm.MCMC([bins, ps])

wo ich glaube ich brauche einen Prior für aund b. Wie soll ich eine auswählen?

Amelio Vazquez-Reina
quelle

Antworten:

9

Ein ähnliches Problem wird in Gelman, Bayesian Data Analysis (2. Auflage, S. 128; 3. Auflage, S. 110) diskutiert . Gelman schlägt ein vorheriges , was die "vorherige Stichprobengröße" effektiv einschränkt , und daher ist der Beta-Hyperprior wahrscheinlich nicht sehr informativ allein. (Wenn die Menge wächst, schrumpft die Varianz der Beta-Verteilung; in diesem Fall schränkt eine geringere vorherige Varianz das "Gewicht" der beobachteten Daten im posterioren Bereich ein.) Zusätzlich setzt dieser Prior nicht, ob , oder umgekehrt, so werden geeignete Verteilungen von Paaren von aus allen Daten zusammen abgeleitet, wie Sie es bei diesem Problem bevorzugen würden. a + b a + b a > b ( a , b )p(a,b)(a+b)5/2a+ba+ba>b(a,b)

Gelman schlägt auch vor, das Modell hinsichtlich des Logits des Mittelwerts von und der "Stichprobengröße" des Prior neu zu parametrisieren. Anstatt also direkt auf , geht es um die Rückschlüsse auf die transformierten Größen und . Dies lässt transformierte vorherige Werte auf der realen Ebene zu, anstatt nicht transformierte vorherige Werte, die streng positiv sein müssen. Dies erreicht auch eine hintere Dichte, die beim Auftragen diffuser ist. Dies macht die beigefügten Grafiken besser lesbar, was ich hilfreich finde.( a , b ) logit ( aθ(a,b)log(a+b)logit(aa+b)log(a+b)

Sycorax sagt Reinstate Monica
quelle
1
Danke @ user777. Leider bin ich nicht in der Lage multivariaten priors im Moment zu verwenden, so dass ich eine Folgefrage links hier
Amelio Vazquez-Reina