Winbugs und andere MCMC ohne Informationen zur vorherigen Verteilung

10

Was passiert, wenn Sie keine Vorstellung von der Parameterverteilung haben? Welchen Ansatz sollten wir verwenden?

Meistens versuchen wir zu verstehen, ob eine bestimmte Variable Einfluss auf das Vorhandensein / Fehlen einer bestimmten Art hat und die Variable je nach Wichtigkeit der Variablen akzeptiert wird oder nicht. Dies bedeutet, dass wir die meiste Zeit nicht über die erwartete Verteilung nachdenken, die ein Parameter haben sollte.

Ist es richtig anzunehmen, dass alle Parameter einer Normalverteilung folgen, wenn ich nur weiß, dass b1, b2, b3 und b4 zwischen -2 und 2 variieren sollten und b0 zwischen -5 und 5 variieren kann?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
quelle
Wenn Sie keinen Prior haben, können Sie keine Bayes'sche Inferenz verwenden. Und daher MCMC-Methodik
Xi'an

Antworten:

6

Parameter im linearen Prädiktor sind t-verteilt . Wenn die Anzahl der Datensätze unendlich ist, konvergiert sie zur Normalverteilung. Also ja, normalerweise wird es als richtig angesehen, eine normale Verteilung der Parameter anzunehmen.

In der Bayes'schen Statistik müssen Sie jedoch keine Parameterverteilung annehmen. Normalerweise geben Sie sogenannte nicht informative Prioritäten an . Für jeden Fall werden unterschiedliche nicht informative Prioritäten empfohlen. In diesem Fall verwenden die Leute oft so etwas wie (Sie können die Werte natürlich anpassen):

dunif(-100000, 100000)

oder

dnorm(0, 1/10^10)

Der zweite ist bevorzugt, da er nicht auf bestimmte Werte beschränkt ist. Mit nicht informativen Prioritäten haben Sie kein Risiko eingegangen. Sie können sie natürlich auf ein bestimmtes Intervall beschränken, aber seien Sie vorsichtig.

Sie geben also einen nicht informativen Prior an und die Parameterverteilung wird selbst ausgegeben! Es müssen keine Annahmen getroffen werden.

Neugierig
quelle
1
Leider ist dies nicht genau richtig: Die Grenzen in der obigen Uniform können das Ergebnis beeinflussen, insb. beim Testen von Hypothesen. Dies ist meiner Meinung nach ein Nachteil von Winbugs.
Xi'an
@ Xi'an - das sage ich natürlich. Deshalb bevorzuge ich in diesem Fall die "flache Normalität" - also die zweite Option. Möglicherweise mit dem Ändern des zweiten Parameters.
Neugierig
1
Hmmm, das ist überhaupt keine Wohnung vor ...
Xi'an
Sie können dnorm(0, 1/10^10)oder was auch immer verwenden
Neugierig
8

Leider können harmlos wirkende Prioren sehr gefährlich sein (und haben sogar einige erfahrene Bayesianer getäuscht).

Dieses kürzlich erschienene Papier bietet eine schöne Einführung zusammen mit Plotmethoden zur Visualisierung des Prior und des Posterior (normalerweise marginale Priors / Posterior für die interessierenden Parameter).

Versteckte Gefahren bei der Angabe nicht informativer Prioritäten. John W. Seaman III, John W. Seaman Jr. und James D. Stamey The American Statistician Band 66, Ausgabe 2, Mai 2012, Seiten 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Solche Diagramme sollten meiner Meinung nach in jeder tatsächlichen Bayes'schen Analyse obligatorisch sein, auch wenn der Analytiker sie nicht benötigt - was in einer Bayes'schen Analyse geschieht, sollte den meisten Lesern klar gemacht werden.

Phaneron
quelle
2
Guter Link, es ist schade, dass es nicht frei verfügbar ist.
Neugierig
6

Die Sensitivitätsanalyse ist normalerweise ein guter Weg: Probieren Sie verschiedene Prioritäten aus und sehen Sie, wie sich Ihre Ergebnisse mit ihnen ändern. Wenn sie robust sind, können Sie wahrscheinlich viele Menschen von Ihren Ergebnissen überzeugen. Andernfalls möchten Sie wahrscheinlich irgendwie quantifizieren, wie die Prioritäten die Ergebnisse ändern.

Wahnsinn
quelle