Normalisierungskonstante im Bayes-Theorem

15

Pr(data)

Pr(parametersdata)=Pr(dataparameters)Pr(parameters)Pr(data)

wird als Normalisierungskonstante bezeichnet . Was genau ist das Was ist seine Aufgabe? Warum sieht es aus wie ? Warum hängt es nicht von den Parametern ab?Pr(data)

Amateur
quelle
4
Wenn Sie f(data|params)f(params) , integrieren Sie die Parameter, sodass das Ergebnis keinen von den Parametern abhängigen Ausdruck hat, auf die gleiche Weise wie x=0x=2xydx=2y hängt nicht von x .
Henry

Antworten:

16

Der Nenner Pr(data) wird erhalten, indem die Parameter aus der Verknüpfungswahrscheinlichkeit Pr(data,parameters) . Dies ist die Grenzwahrscheinlichkeit der Daten und hängt natürlich nicht von den Parametern ab, da diese herausintegriert wurden.

Jetzt seit:

  • Pr(data) hängt nicht von den Parametern ab, auf die man schließen möchte.
  • Pr(data) ist im Allgemeinen in geschlossener Form schwer zu berechnen.

man verwendet oft die folgende Anpassung der Baye-Formel:

Pr(parametersdata)Pr(dataparameters)Pr(parameters)

Grundsätzlich ist nichts anderes als eine "normalisierende Konstante", dh eine Konstante, die die posteriore Dichte zu einer einzigen integriert .Pr(data)

Ocram
quelle
2
Was genau meinen Sie mit "durch Herausintegrieren der Parameter"? Was bedeutet es in diesem Zusammenhang genau, sich zu integrieren?
nbro
2
@ nbro: Ich meine Pr (Daten) = Integral über die Parameter von Pr (Daten, Parameter)
Ocram
2

Wenn wir die Bayes-Regel anwenden, möchten wir normalerweise auf die "Parameter" schließen, und die "Daten" sind bereits angegeben. Daher ist eine Konstante und wir können davon ausgehen, dass es sich nur um einen normalisierenden Faktor handelt.Pr(data)

Hart
quelle