Wie kann ich zwei Ereignisse, die mit Takt Null auftreten, nach Bayes aktualisieren?

7

Um zu veranschaulichen, was ich meine, betrachten Sie bitte das folgende hypothetische Szenario:

Die Lieblingszahl einer Person wird mit der atomlosen Dichtefunktion zufällig verteilt .x[1,1]f(x)

Nehmen wir außerdem an, dass diese Person (nachdem sie erkannt hat, was ihre Lieblingszahl ist) den absoluten Wert dieser Lieblingszahl, dh aufruft .x|x|

Als Beobachter kennen Sie die Struktur, dh die Verteilung von und das Verhalten der Person. Wenn Sie also sagen, dass , wissen Sie, dass die Lieblingszahl der Person entweder 0,5 oder -0,5 ist.x|x|=0.5

Aber was sollten Sie als Bayesianischer Updater glauben? Ist es sinnvoll zu sagen, dass Sie glauben, dass die Lieblingszahl der Person 0,5 mit der Wahrscheinlichkeit

P[x=0.5||x|=0.5]=P[|x|=0.5|x=0.5]f(0.5)f(0.5)+f(0.5)=f(0.5)f(0.5)+f(0.5)?

Ich vermute nicht, da jede Verteilung (in verschiedener Hinsicht) Änderungen bei Ereignissen des Maßes Null entspricht. Aber was ist in einem solchen Szenario zu tun?

Ich hätte gedacht, dass ein solches Problem in der Wirtschaftstheorie auftreten würde (Signalisierungsspiele), aber ich habe noch keine Referenz gefunden, die sich mit diesem Thema befasst (Vorschläge hier wären ebenfalls sehr willkommen).

Biene
quelle
"Jede Verteilung ist (in verschiedener Hinsicht) gleichbedeutend mit Änderungen bei Ereignissen des Maßes Null" - was bedeutet das?
Jbowman
Ich glaube, dass Ihre Formel für das Bayes'sche Update korrekt ist und ich, wie der andere Kommentator, nicht verstehe, was Sie mit Ihrer Aussage zur äquivalenten Verteilung meinen?
mlofton
1
Was ich meine ist, dass in vielen gut erzogenen Funktionsräumen wie Räumen (manchmal als Lebesgue-Raum bezeichnet) zwei beliebige Funktionen, die sich nur in einem Satz von Maß Null unterscheiden, als äquivalent betrachtet werden. Somit werden die Funktion in meinem Beispiel und wenn und als äquivalent angesehen werden. Dies würde jedoch offensichtlich die Wahrscheinlichkeit verzerren, wenn die von mir geschriebene Gleichung korrekt ist (was ich nicht vermute). LPfg(x)=f(x)x0.5g(0.5)=2f(0.5)P[x=0.5||x|=0.5]
Biene
1
@bee: Es ist wirklich subtil, aber die beiden Verteilungen werden in vielen Aspekten gleich sein (dh CDF, Mittelwert, Varianz usw.). Sie haben gerade geschickt einen Aspekt gezeigt, in dem es eigentlich kein Äquivalent gibt.
Cliff AB
1
@ Xi'an: Angenommen, und sind zwei pdfs für kontinuierliche Verteilungen für RVs , , wobei und bis zu einer zählbaren Menge von Punkten gleich sind. Dann sind die CDFs für und gleich, was auch den Mittelwert, die Varianz usw. impliziert. Die Schlussfolgerung, die wir aufgrund der Beobachtung von Elementen in der zählbaren Menge von Meinungsverschiedenheiten zwischen den beiden PDFs ziehen, ist jedoch nicht. Wie Sie in Ihrer Antwort hervorheben, ist das Maß dieser Menge natürlich 0, sodass Sie argumentieren können, dass dies keine wirkliche Konsequenz hat. ffXX.'ff'X.X.'
Cliff AB

Antworten:

4

Das Paradoxon ist eher eine der Maßtheorie und Konditionierung als eine der Bayes'schen Folgerungen (und daher sollten Sie den Titel der Frage ändern). Um Andrei Kolmogorov zu zitieren,

" Das Konzept einer bedingten Wahrscheinlichkeit in Bezug auf eine isolierte Hypothese, deren Wahrscheinlichkeit gleich 0 ist, ist unzulässig. "

Wenn man die Dichte der Zufallsvariablen , kann es sich tatsächlich um alles handeln, einschließlich der Nullfunktion für jede Menge von Maß Null. Es scheint mir jedoch, dass die einfachste Erklärung darin besteht, dass man die Menge a posteriori , dh einmal oder nicht wählen kann ist zu beobachten, , so daß . Dies bedeutet, dass die tatsächliche Beobachtung (oder genauer die tatsächliche Realisierung der Zufallsvariablen ) die Wahrscheinlichkeit Null hat, zu zu gehören .fX.EIN(- -1,1)EIN X.|X.|xxEINxxX.EIN

Beim Einstellen

P.[X.=0,5||X.|=0,5]]=P.[|X.|=0,5|X.=0,5]]f(0,5)f(0,5)+f(- -0,5)=f(0,5)f(0,5)+f(- -0,5)
(a) Die erste Gleichheit ist eine falsche Anwendung der Bayes-Formel für Mengen, da die Mengen das Maß Null haben und (b) die Menge des Maßes Null bedingt {ω;;|X.(ω)|=0,5}} ist eher als bedingte Wahrscheinlichkeit als Festlegen des Wertes der Funktion zu verstehen
E.[ichX.=|X.|||X.|=x]]
beim x=0,5, was nicht eindeutig definiert ist, da die einzige Einschränkung die Definition von bedingten Erwartungen als ist
P.[X.=|X.|]]=E.{E.[ichX.=|X.|||X.|]]}}
Xi'an
quelle
Danke für die Antwort! Stimmen Sie zu, dass es im Allgemeinen darum geht, zwischen einem atomlosen Maß (gegeben durch) zu wechseln?f) zu einem diskreten Maß (der hintere P.[X.=x||X.|=0,5]])? In dem Sinne, dass,f ist aber absolut kontinuierlich für Lebesgue-Maß P.[X.=x||X.|=0,5]]ist nicht. Daher kann die Übersetzung zwischen Kennzahlen niemals unveränderlich sein, um Nullereignisse zu messen, und insbesondere ist der Radon-Nikodym-Satz nicht anwendbar. Ich glaube, dies entspricht dem, was @CliffAB vorgeschlagen hat.
Biene
Nein, ich sehe das nicht als Erklärung. Das Gleiche gilt für jede bedingte Verteilung einer diskreten Variablen, die von einer absolut kontinuierlichen abhängig ist. Und ich fürchte, ich verstehe die Verbindung zum Radon-Nikodym-Theorem nicht.
Xi'an