Wenn wir eine kleine Stichprobengröße haben, hat die vorherige Verteilung einen großen Einfluss auf die hintere Verteilung?
bayesian
sample-size
prior
toby j
quelle
quelle
Antworten:
Ja. Die posteriore Verteilung für einen Parameter bei gegebenem Datensatz kann wie folgt geschrieben werdenXθ X
oder, wie es auf der Log-Skala üblicher ist,
Das Log-Likelihood, , skaliert mit dem Stichprobenumfang , da es eine Funktion die ist Daten, während die vorherige Dichte nicht. Daher wird mit zunehmender Stichprobengröße der Absolutwert von größer, während θlog (p (θ)) fest bleibt (für einen festen Wert von θ ), so dass Die Summe L (θ; {\ bf X}) + \ log (p (θ)) wird mit zunehmender Stichprobengröße stärker von L (θ; {\ bf X}) beeinflusst .L ( θ ; X ) = log(p(X|θ)) log ( p ( θ ) ) θ L ( θ ; X ) + log ( p ( θ ) ) L ( θ ; X )L(θ;X) log(p(θ)) θ L(θ;X)+log(p(θ)) L(θ;X)
Um Ihre Frage direkt zu beantworten: Die vorherige Verteilung wird immer weniger relevant, da sie durch die Wahrscheinlichkeit aufgewogen wird. Bei einer kleinen Stichprobengröße spielt daher die vorherige Verteilung eine viel größere Rolle. Dies stimmt mit der Intuition überein, da zu erwarten ist, dass frühere Spezifikationen eine größere Rolle spielen würden, wenn nicht viele Daten verfügbar sind, um sie zu widerlegen, während bei sehr großen Stichproben das in den Daten vorhandene Signal alle a priori überwiegt Überzeugungen wurden in das Modell aufgenommen.
quelle
Hier ist ein Versuch, den letzten Absatz in Macros exzellenter (+1) Antwort zu veranschaulichen. Es zeigt zwei Prioritäten für den Parameter in der -Verteilung. Für einige verschiedene sind die hinteren Verteilungen gezeigt, wenn beobachtet wurde. Als wächst, werden beiden Seitenzähne mehr und mehr um konzentriert .p B i n o m i a l (n,p) n x = n / 2 n 1 / 2
Für der Unterschied ziemlich groß, aber für gibt es praktisch keinen Unterschied.n = 2 n = 50
Die beiden folgenden Prioren sind (schwarz) und (rot). Die Posteriors haben die gleichen Farben wie die Priors, von denen sie abgeleitet sind.B e t a ( 1 / 2 , 1 / 2 ) B e t a ( 2 , 2 )
(Beachten Sie, dass für viele andere Modelle und andere Vorgänger nicht ausreicht, damit der Vorgänger keine Rolle spielt!)n = 50
quelle