Nehmen wir an, ich versuche herauszufinden, mit welcher Wahrscheinlichkeit Vanille das beliebteste Eis ist.
Ich weiß, dass die Person auch Horrorfilme mag.
Ich möchte die Wahrscheinlichkeit herausfinden, dass das Lieblingseis der Person Vanille ist, da sie Horrorfilme mag.
Ich weiß folgendes:
- der Menschen wählen Vanille als ihren Lieblingseisgeschmack. (Dies ist mein )
- der Menschen, deren Favorit Vanilleeis ist, lieben auch Horrorfilme. (Dies ist mein )
- der Leute, deren Favorit nicht Vanilleeis ist, lieben auch Horrorfilme (Dies ist mein )
Also berechne ich es so: Ich finde, dass (auf das nächste Zehntausendstel gerundet). Es besteht eine Wahrscheinlichkeit von dass Vanille das beliebteste Eis eines Horrorfilmfans ist.
Aber dann erfahre ich, dass die Person in den letzten 30 Tagen einen Horrorfilm gesehen hat. Folgendes weiß ich:
- ist die aktualisierte hintere Wahrscheinlichkeit, dass Vanille das beliebteste Eis der Person ist - das in diesem nächsten Problem.
- der Menschen, deren Favorit Vanilleeis ist, haben in den letzten 30 Tagen einen Horrorfilm gesehen.
- der Menschen, deren Favorit nicht Vanilleeis ist, haben in den letzten 30 Tagen einen Horrorfilm gesehen.
Dies ergibt: wenn gerundet.
Jetzt glaube ich, dass es eine gibt, dass der Horrorfilmfan Eis liebt, da er in den letzten 30 Tagen einen Horrorfilm gesehen hat.
Aber warte, da ist noch etwas. Ich habe auch erfahren, dass die Person eine Katze besitzt.
Folgendes weiß ich:
- ist die aktualisierte hintere Wahrscheinlichkeit, dass Vanille das beliebteste Eis der Person ist - das in diesem nächsten Problem
- der Menschen, deren Favorit Vanilleeis ist, besitzen auch Katzen
- of people whose favorite is not vanilla ice cream also own cats
This gives:
My question basically boils down to this: Am I correctly updating probability using Bayes' theorem? Am I getting anything else wrong in my methods?
quelle
Antworten:
This is not correct. Sequential updating of this type only works when the information you are receiving sequentially is independent (e.g. iid observations of a random variable). If each observation is not independent, as in this case, you need to consider the joint probability distribution. The correct way to update would be to go back to the prior, find the joint probability that someone loves horror movies, has seen a horror movie in the last 30 days, and owns a cat given that they do or do not choose vanilla as their favorite ice cream flavor, and then update in a single step.
Updating sequentially like this when your data are not independent will rapidly drive your posterior probability much higher or lower than it ought to be.
quelle