Der einfache Unterschied zwischen den beiden besteht darin, dass die hintere Verteilung von dem unbekannten Parameter ; abhängt , dh die hintere Verteilung ist:
wobei ist die Normalisierungskonstante.θp(θ|x)=c×p(x|θ)p(θ)
c
Andererseits hängt die posteriore prädiktive Verteilung nicht von dem unbekannten Parameter da sie herausintegriert wurde, dh die posteriore prädiktive Verteilung ist:
θp(x∗|x)=∫Θc×p(x∗,θ|x)dθ=∫Θc×p(x∗|θ)p(θ|x)dθ
Dabei ist eine neue unbeobachtete Zufallsvariable und unabhängig von .x∗x
Ich werde nicht auf die Erklärung der posterioren Verteilung eingehen, da Sie sagen, dass Sie sie verstehen, aber die posterioren Verteilung "ist die Verteilung einer unbekannten Größe, die als Zufallsvariable behandelt wird, abhängig von den erhaltenen Beweisen" (Wikipedia). Im Grunde ist es die Verteilung, die Ihren unbekannten, zufälligen Parameter erklärt.
Andererseits hat die nachträgliche Vorhersageverteilung eine völlig andere Bedeutung, da sie die Verteilung für zukünftige Vorhersagedaten auf der Grundlage der Daten ist, die Sie bereits gesehen haben. Die posteriore Vorhersageverteilung wird also im Wesentlichen verwendet, um neue Datenwerte vorherzusagen.
Wenn es hilft, ist ein Beispieldiagramm einer posterioren Verteilung und einer posterioren prädiktiven Verteilung:
Die Vorhersageverteilung wird normalerweise verwendet, wenn Sie eine posteriore Verteilung für den Parameter eines Vorhersagemodells gelernt haben. Zum Beispiel lernen Sie in der Bayes'schen linearen Regression eine posteriore Verteilung über den w-Parameter des Modells y = wX, wenn einige beobachtete Daten X vorliegen.
Wenn dann ein neuer unsichtbarer Datenpunkt x * eintritt , möchten Sie die Verteilung über mögliche Vorhersagen y finden * gegeben die hintere Verteilung für w, die Sie gerade gelernt haben. Diese Verteilung über mögliche y * ist bei gegebenem Posterior für w die Vorhersageverteilung.
quelle
Sie beziehen sich auf Verteilungen von zwei verschiedenen Dingen.
Die hintere Verteilung bezieht sich auf die Verteilung des Parameters , während sich die prädiktive hintere Verteilung (Predictive Posterior Distribution, PPD) auf die Verteilung zukünftiger Beobachtungen von Daten bezieht .
quelle