Der Bayes-Satz
Das ist alles in Ordnung. Aber ich habe irgendwo gelesen:
Grundsätzlich ist P (Daten) nichts anderes als eine Normalisierungskonstante, dh eine Konstante, die die posteriore Dichte zu eins integriert.
Wir wissen, dass und . 0 ≤ P ( Daten | Modell ) ≤ 1
Daher muss auch zwischen 0 und 1 liegen. Warum brauchen wir in einem solchen Fall eine Normalisierungskonstante, um den posterioren Teil in einen zu integrieren?
probability
bayesian
conditional-probability
bayes
Sreejith Ramakrishnan
quelle
quelle
0 <= P(model) <= 1
noch0 <= P(data/model) <= 1
, weil entweder (oder sogar beides!) Diejenigen überschreiten (und sogar unendlich sein). Siehe stats.stackexchange.com/questions/4220 .Antworten:
Erstens ist das Integral von "Wahrscheinlichkeit x vor" nicht unbedingt 1 .
Es ist nicht wahr, wenn:
dann ist das Integral dieses Produkts in Bezug auf das Modell (in der Tat auf die Parameter des Modells) 1.
Demonstration. Stellen Sie sich zwei diskrete Dichten vor:
Wenn Sie beide multiplizieren, erhalten Sie: was keine gültige Dichte ist, da sie nicht zu eins integriert wird: 0,40 + 0,25 = 0,65
Was sollen wir also tun, um das Integral zu zwingen, 1 zu sein? Verwenden Sie den Normalisierungsfaktor:
(Entschuldigung für die schlechte Schreibweise. Ich habe drei verschiedene Ausdrücke für dieselbe Sache geschrieben, da Sie sie möglicherweise alle in der Literatur finden.)
Zweitens kann die "Wahrscheinlichkeit" irgendetwas sein, und selbst wenn es sich um eine Dichte handelt, kann sie Werte über 1 haben .
Wie @whuber sagte, müssen diese Faktoren nicht zwischen 0 und 1 liegen. Sie müssen das Integral (oder die Summe) 1 haben.
Drittens [extra] sind "Konjugate" Ihre Freunde, die Ihnen helfen, die Normalisierungskonstante zu finden .
Sie werden oft sehen: weil der fehlende Nenner leicht sein kann Holen Sie sich durch die Integration dieses Produkts. Beachten Sie, dass diese Integration ein bekanntes Ergebnis hat, wenn der Prior und die Wahrscheinlichkeit konjugiert sind .
quelle
Die kurze Antwort auf Ihre Frage lautet, dass der Ausdruck auf der rechten Seite ohne Nenner lediglich eine Wahrscheinlichkeit ist , keine Wahrscheinlichkeit , die nur von 0 bis 1 reichen kann das Eintreten eines Ereignisses und nicht nur die relative Wahrscheinlichkeit dieses Ereignisses im Vergleich zu einem anderen.
quelle
Sie haben bereits zwei gültige Antworten erhalten, aber lassen Sie mich meine zwei Cent hinzufügen.
Der Bayes-Satz wird häufig definiert als:
weil der einzige Grund, warum Sie die Konstante brauchen, ist, dass sie zu 1 integriert wird (siehe die Antworten von anderen). Dies ist in den meisten MCMC-Simulationsansätzen für die Bayes'sche Analyse nicht erforderlich, und daher wird die Konstante aus der Gleichung gestrichen. Für die meisten Simulationen ist es also nicht einmal erforderlich.
Ich liebe die Beschreibung von Kruschke : Der letzte Welpe (konstant) ist müde, weil er in der Formel nichts zu tun hat.
Auch einige, wie Andrew Gelman, betrachten die Konstante als "überbewertet" und "im Grunde genommen bedeutungslos, wenn Leute flache Prioritäten verwenden" (siehe die Diskussion hier ).
quelle