Flach, konjugiert und hyperprior. Was sind Sie?

15

Ich lese gerade über Bayes'sche Methoden in der Computation Molecular Evolution von Yang. In Abschnitt 5.2 geht es um Prioritäten und insbesondere um Nicht-informative, flache, vage, diffuse, konjugierte und hyperpriore Prioritäten.

Dies könnte zu einer übermäßigen Vereinfachung führen, aber könnte jemand einfach den Unterschied zwischen diesen Arten von Prioren erklären und wie sich dies auf das Ergebnis einer Analyse / Entscheidungen auswirkt, die ich während des Prozesses einer Bayes'schen Analyse treffen würde?

(Ich bin kein Statistiker und beginne gerade damit, Bayesianische Analysen zu lernen. Je mehr es für Laien gilt, desto besser.)

rg255
quelle

Antworten:

15

Einfach ausgedrückt, wird ein flacher / nicht informativer Prior verwendet, wenn man wenig / kein Wissen über die Daten hat und daher den geringsten Einfluss auf die Ergebnisse Ihrer Analyse hat (dh posterioren Rückschluss).

Konjugatverteilungen sind diejenigen, deren vorherige und hintere Verteilung gleich sind, und der Prior wird als konjugierter Prior bezeichnet. Es wird wegen seiner algebraischen Bequemlichkeiten bevorzugt , insbesondere wenn die Wahrscheinlichkeit eine Verteilung in Form einer Exponentialfamilie (Gauß, Beta usw.) aufweist. Dies ist von großem Vorteil, wenn posteriore Simulationen mit Gibbs-Sampling durchgeführt werden.

Stellen Sie sich schließlich vor, dass für einen Parameter in Ihrem Modell eine vorherige Verteilung festgelegt ist, Sie jedoch eine weitere Ebene der Komplexität / Unsicherheit hinzufügen möchten. Sie würden dann eine vorherige Verteilung auf die Parameter der oben genannten Stand, daher der Name verhängen hyper -prior.

Ich denke, Gelmans Bayesian Data Analysis ist ein großartiger Einstieg für alle, die Bayesian Statistics lernen möchten :)

Honigchip
quelle
1
Zweitens die Bestätigung der Bayesianischen Datenanalyse.
Sycorax sagt Reinstate Monica
14

Auf der höchsten Ebene können wir uns alle Arten von Prioritäten vorstellen, indem wir eine bestimmte Menge an Informationen spezifizieren, die der Forscher auf die Analyse außerhalb der Daten selbst anwendet: Welche Parameterwerte sind vor dem Betrachten der Daten wahrscheinlicher?

In den dunklen Zeiten der Bayesianischen Analyse, als die Bayesianer mit Frequentisten kämpften, bestand die Überzeugung, dass der Forscher so wenig Informationen wie möglich über den Vorgänger in die Analyse einbringen wollte. Es wurde also viel recherchiert und diskutiert, um zu verstehen, wie ein Prior auf diese Weise "nicht informativ" sein kann. Heute spricht sich Gelman gegen die automatische Auswahl nicht-informativer Prioritäten aus, wie es in der Bayesian Data Analysis heißtdass die Beschreibung "nicht informativ" eher seine Haltung gegenüber dem Prior widerspiegelt als irgendwelche "besonderen" mathematischen Merkmale des Prior. (Außerdem gab es in der frühen Literatur eine Frage, in welchem ​​Umfang ein Prior nicht aussagekräftig ist. Ich denke nicht, dass dies für Ihre Frage besonders wichtig ist, aber ein gutes Beispiel für dieses Argument aus einer häufigeren Perspektive finden Sie am Anfang von Gary King, Politische Methodik vereinheitlichen. )

Ein "flacher" Prior gibt einen einheitlichen Prior an, bei dem alle Werte im Bereich gleich wahrscheinlich sind. Auch hier gibt es Argumente dafür, ob diese wirklich nicht informativ sind, da die Angabe, dass alle Werte gleich wahrscheinlich sind, in gewisser Weise Informationen sind und empfindlich auf die Parametrisierung des Modells reagieren können. Flat Priors haben eine lange Geschichte in der Bayesianischen Analyse und reichen zurück bis nach Bayes und Laplace.

Ein "vager" Prior ist sehr diffus, wenn auch nicht unbedingt flach, und er drückt aus, dass ein großer Wertebereich plausibel ist, anstatt die Wahrscheinlichkeitsmasse auf einen bestimmten Bereich zu konzentrieren. Im Wesentlichen ist es ein Prior mit hoher Varianz (was auch immer "hohe" Varianz in Ihrem Kontext bedeutet).

Konjugierte Prioren haben die praktische Eigenschaft, dass sie, wenn sie mit der entsprechenden Wahrscheinlichkeit multipliziert werden, einen Ausdruck in geschlossener Form erzeugen. Ein Beispiel hierfür ist das Beta vor der Binomialwahrscheinlichkeit oder das Gamma vor der Poissonwahrscheinlichkeit. Es gibt hilfreiche Tabellen über das Internet und Wikipedia. Die exponentielle Familie ist in dieser Hinsicht äußerst praktisch.

Conjugate Priors sind aufgrund ihrer praktischen Eigenschaften häufig die "Standard" -Option für einige Probleme. Dies bedeutet jedoch nicht unbedingt, dass sie die "besten" sind, es sei denn, die Vorkenntnisse können über das Conjugate Prior ausgedrückt werden. Fortschritte in der Berechnung bedeuten, dass die Konjugation nicht mehr so ​​hoch geschätzt wird wie früher (vgl. Gibbs-Stichprobe vs. NUTS), so dass wir ohne großen Aufwand leichter auf nicht konjugierte Prioritäten schließen können.

N(μ,σ2)μσ2μσ2

Sycorax sagt Reinstate Monica
quelle
1
Außerdem ist es manchmal nicht klar, was "Daten" und was "Vorinformationen" sind. Schauen Sie sich meine Antwort auf stats.stackexchange.com/questions/112451/… als Beispiel an.
kjetil b halvorsen