Was passiert, wenn Sie keine Vorstellung von der Parameterverteilung haben? Welchen Ansatz sollten wir verwenden?
Meistens versuchen wir zu verstehen, ob eine bestimmte Variable Einfluss auf das Vorhandensein / Fehlen einer bestimmten Art hat und die Variable je nach Wichtigkeit der Variablen akzeptiert wird oder nicht. Dies bedeutet, dass wir die meiste Zeit nicht über die erwartete Verteilung nachdenken, die ein Parameter haben sollte.
Ist es richtig anzunehmen, dass alle Parameter einer Normalverteilung folgen, wenn ich nur weiß, dass b1, b2, b3 und b4 zwischen -2 und 2 variieren sollten und b0 zwischen -5 und 5 variieren kann?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Antworten:
Parameter im linearen Prädiktor sind t-verteilt . Wenn die Anzahl der Datensätze unendlich ist, konvergiert sie zur Normalverteilung. Also ja, normalerweise wird es als richtig angesehen, eine normale Verteilung der Parameter anzunehmen.
In der Bayes'schen Statistik müssen Sie jedoch keine Parameterverteilung annehmen. Normalerweise geben Sie sogenannte nicht informative Prioritäten an . Für jeden Fall werden unterschiedliche nicht informative Prioritäten empfohlen. In diesem Fall verwenden die Leute oft so etwas wie (Sie können die Werte natürlich anpassen):
oder
Der zweite ist bevorzugt, da er nicht auf bestimmte Werte beschränkt ist. Mit nicht informativen Prioritäten haben Sie kein Risiko eingegangen. Sie können sie natürlich auf ein bestimmtes Intervall beschränken, aber seien Sie vorsichtig.
Sie geben also einen nicht informativen Prior an und die Parameterverteilung wird selbst ausgegeben! Es müssen keine Annahmen getroffen werden.
quelle
dnorm(0, 1/10^10)
oder was auch immer verwendenLeider können harmlos wirkende Prioren sehr gefährlich sein (und haben sogar einige erfahrene Bayesianer getäuscht).
Dieses kürzlich erschienene Papier bietet eine schöne Einführung zusammen mit Plotmethoden zur Visualisierung des Prior und des Posterior (normalerweise marginale Priors / Posterior für die interessierenden Parameter).
Versteckte Gefahren bei der Angabe nicht informativer Prioritäten. John W. Seaman III, John W. Seaman Jr. und James D. Stamey The American Statistician Band 66, Ausgabe 2, Mai 2012, Seiten 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
Solche Diagramme sollten meiner Meinung nach in jeder tatsächlichen Bayes'schen Analyse obligatorisch sein, auch wenn der Analytiker sie nicht benötigt - was in einer Bayes'schen Analyse geschieht, sollte den meisten Lesern klar gemacht werden.
quelle
Die Sensitivitätsanalyse ist normalerweise ein guter Weg: Probieren Sie verschiedene Prioritäten aus und sehen Sie, wie sich Ihre Ergebnisse mit ihnen ändern. Wenn sie robust sind, können Sie wahrscheinlich viele Menschen von Ihren Ergebnissen überzeugen. Andernfalls möchten Sie wahrscheinlich irgendwie quantifizieren, wie die Prioritäten die Ergebnisse ändern.
quelle