Die Formel für die bedingte Wahrscheinlichkeit von Happening da passiert ist:B P ( A
Mein Lehrbuch erklärt die Intuition dahinter anhand eines Venn-Diagramms.
Angesichts dessen, dass aufgetreten ist, besteht die einzige Möglichkeit, dass eintritt, darin, dass das Ereignis in den Schnittpunkt von und fällt .A A B
In diesem Fall wäre die Wahrscheinlichkeit von einfach gleich der Wahrscheinlichkeit von intersection , da Nur so könnte das Ereignis passieren? Was vermisse ich? A B
Antworten:
Eine gute Anschauung ist gegeben, dass B - mit oder ohne A - aufgetreten ist. Wie hoch ist die Wahrscheinlichkeit für A? Das heißt, wir befinden uns jetzt in dem Universum, in dem B vorkam - der volle rechte Kreis. In diesem Kreis ist die Wahrscheinlichkeit von A die Fläche von A, die B schneidet, geteilt durch die Fläche des Kreises.
quelle
Ich würde es so sehen: Ich nehme an, dass Sie die Intuition verstehen, bis:
und ich werde das zweite Bild kommentieren, das du gepostet hast:
Stellen Sie sich vor, das gesamte weiße Rechteck ist Ihr Beispielraum .Ω
Das Zuweisen einer Wahrscheinlichkeit zu einer Menge bedeutet, dass Sie diese Menge in gewisser Weise messen . Es ist dasselbe, als hätten Sie die Fläche des Rechtecks gemessen, aber die Wahrscheinlichkeit ist eine andere Art von Maß, die bestimmte Eigenschaften hat (dazu werde ich nichts weiter sagen).
Sie wissen, dass und dies wie folgt interpretiert wird:P(Ω)=1
Analog hat die Menge eine Wahrscheinlichkeit , die proportional zur Wahrscheinlichkeit des Abtastraums . Grafisch gesehen ist daher muss das Maß für (seine Wahrscheinlichkeit ) kleiner sein als . Dieselbe Argumentation ist für den Satz gültig . Dieser Satz kann gemessen werden und sein Maß ist .P ( A ) Ω A ⊂ Ω A P ( A ) , P ( Ω ) A ∩ B P ( A ∩ B )A P(A) Ω A⊂Ω A P(A) P(Ω) A∩B P(A∩B)
Wenn Ihnen jetzt gesagt wird, dass passiert ist, müssen Sie denken, als wäre Ihr "neues" . Wenn Ihr "neues" ist, können Sie zu 100% sicher sein, dass in der Menge alles passiert .B B Ω B Ω B
Und was bedeutet das? Dies bedeutet, dass Sie jetzt im "neuen" Wettbewerb alle Wahrscheinlichkeitsmaße neu skalieren müssen, wobei zu berücksichtigen ist, dass sie in Bezug auf den "neuen" Probenraum ausgedrückt werden müssen . Es ist eine einfache Proportion.P(B∣B)=1 B
Deine Intuition ist fast richtig, wenn du das sagst:
und das "fast" ist auf die Tatsache zurückzuführen, dass sich jetzt Ihr Sampleraum geändert hat (es ist jetzt ) und Sie entsprechend neu skalieren möchten .B P(A∩B)
In der neuen Welt muss das Verhältnis zwischen dem Maß von und dem Maß von dasselbe sein wie das Verhältnis zwischen dem Maß von und dem Maß vonB A∩B Ω A∣B
Zuletzt übersetze dies in mathematische Sprache (eine einfache Proportion):
und da folgt, dass:P(Ω)=1
quelle
Sie werden sehen, wie die Intuition leicht über das folgende Problem nachdenkt.
Angenommen, Sie haben 10 Bälle: 6 schwarze und 4 rote. Von schwarzen Bällen sind 3 fantastisch und von roten Bällen ist nur 1 fantastisch. Wie wahrscheinlich ist es, dass ein schwarzer Ball auch fantastisch ist?
Die Antwort ist sehr einfach: Es ist 50%, weil wir 3 Awesome Black Bälle von insgesamt 6 Black Bällen haben.
So ordnen Sie Wahrscheinlichkeiten unserem Problem zu:
quelle
Für eine grundlegende Intuition der bedingten Wahrscheinlichkeitsformel verwende ich immer gerne eine Zwei-Wege-Tabelle. Nehmen wir an, eine Jahrgangsgruppe besteht aus 150 Schülern, von denen 80 weiblich und 70 männlich sind und jeder genau einen Sprachkurs belegen muss. Die Zwei-Wege-Tabelle der Studenten, die an verschiedenen Kursen teilnehmen, lautet:
Wie hoch ist die Wahrscheinlichkeit, dass ein Student den Italienischkurs besucht, wenn er weiblich ist? Nun, der Italienischkurs hat 60 Studenten, von denen 40 Frauen Italienisch lernen. Die Wahrscheinlichkeit muss also sein:
Aber wenn die Frage umgedreht würde, wie hoch ist die Wahrscheinlichkeit, dass ein Student den Italienischkurs belegt, wenn er weiblich ist? Dann belegen 40 der 80 Studentinnen den Italienischkurs. Wir haben also:
Ich hoffe, das liefert die Intuition für das Warum
Zu verstehen, warum der Bruch mit Wahrscheinlichkeiten anstelle von Kardinalitäten geschrieben werden kann, ist eine Frage äquivalenter Brüche . Kehren wir zum Beispiel zu der Wahrscheinlichkeit zurück, dass eine Studentin weiblich ist, wenn sie Italienisch lernt. Es gibt insgesamt 150 Studenten, die Wahrscheinlichkeit, dass ein Student weiblich ist und Italienisch lernt, beträgt 40/150 (dies ist eine "gemeinsame" Wahrscheinlichkeit) und die Wahrscheinlichkeit, dass ein Student Italienisch lernt, beträgt 60/150 (dies ist eine "marginale" Wahrscheinlichkeit) ). Beachten Sie, dass das Teilen der gemeinsamen Wahrscheinlichkeit durch die Grenzwahrscheinlichkeit Folgendes ergibt:
(Um zu sehen, dass die Brüche gleich sind, wird durch Multiplizieren von Zähler und Nenner mit 150 jeweils das "/ 150" entfernt.)
Wenn Ihr Abtastraum allgemeinerΩ n(Ω)
quelle
Dies wird dir geben
quelle
Das Venn-Diagramm repräsentiert nicht die Wahrscheinlichkeit, sondern das Maß für Teilmengen des Ereignisraums. Eine Wahrscheinlichkeit ist das Verhältnis zwischen zwei Maßen; Die Wahrscheinlichkeit von X ist die Größe von "Alles, was X ausmacht" geteilt durch die Größe von "Alle berücksichtigten Ereignisse". Jedes Mal, wenn Sie eine Wahrscheinlichkeit berechnen, benötigen Sie sowohl einen "Erfolgsraum" als auch einen "Bevölkerungsraum". Sie können eine Wahrscheinlichkeit nicht basierend darauf berechnen, "wie groß" der Erfolgsraum ist. Zum Beispiel ist die Wahrscheinlichkeit, eine Sieben mit zwei Würfeln zu würfeln, die Anzahl der Möglichkeiten, eine Sieben zu würfeln, geteilt durch die Gesamtanzahl der Möglichkeiten, zwei Würfel zu würfeln. Nur die Anzahl der Möglichkeiten, eine Sieben zu würfeln, zu kennen, reicht nicht aus, um die Wahrscheinlichkeit zu berechnen. P (A | B) ist das Verhältnis des Maßes von "sowohl A als auch B passieren" Raum und das Maß des "B passiert" Raum. Das ist, was das "|" bedeutet: es bedeutet "mach was danach kommt zum bevölkerungsraum".
quelle
Ich denke, die beste Art, darüber nachzudenken, ist, schrittweise Wege zu gehen.
quelle
Denken Sie in Zählungen darüber nach. Die Grenzwahrscheinlichkeit gibt an, wie oft A aufgetreten ist, geteilt durch die Stichprobengröße. Die gemeinsame Wahrscheinlichkeit von A und B gibt an, wie oft A zusammen mit B aufgetreten ist, dividiert durch die Stichprobengröße. Die bedingte Wahrscheinlichkeit für A bei gegebenem B ist, wie oft A zusammen mit B aufgetreten ist, geteilt durch die Häufigkeit, mit der B aufgetreten ist, dh nur die A-Werte "innerhalb" der B-Werte.
Auf diesem Blog finden Sie eine schöne visuelle Illustration , die es anhand von Legoblöcken zeigt.
quelle
Zum Zeitpunkt des Schreibens gibt es ungefähr 10 Antworten, die anscheinend alle den wichtigsten Punkt verfehlen: Sie haben im Wesentlichen Recht.
quelle
Ich halte es für intuitiver, wenn wir konkrete Daten zur Abschätzung der Wahrscheinlichkeiten haben.
Nehmen wir
mtcars
als Beispiel Daten, die Daten sehen so aus (wir verwenden nur die Anzahl der Zylinder und den Getriebetyp.)Wir können die gemeinsame Verteilung auf zwei Variablen berechnen , indem wir eine Kreuztabelle erstellen:
Die gemeinsame Wahrscheinlichkeit bedeutet, dass wir zwei Variablen gleichzeitig berücksichtigen möchten. Zum Beispiel werden wir fragen, wie viele Autos 4 Zylinder und Schaltgetriebe sind.
Nun kommen wir zur bedingten Wahrscheinlichkeit. Ich fand den intuitivsten Weg, die bedingte Wahrscheinlichkeit zu erklären, darin, den Begriff Datenfilterung zu verwenden.
Das heißt, wir kümmern uns nur um Autos mit 4 Zylindern. Also filtern wir Daten danach. Nach dem Filtern prüfen wir, wie viele davon manuell übertragen werden.
Sie können dies bedingt mit dem bereits erwähnten Gelenk vergleichen, um die Unterschiede zu spüren.
quelle
Wenn
A
eine ObermengeB
der Wahrscheinlichkeit, dieA
auftritt, immer 1 ist, istB
dies der Fall, dP(A|B) = 1
. H. AllerdingsB
kann sich eine Wahrscheinlichkeit viel kleiner als 1 haben.Betrachten Sie das folgende Beispiel:
x
ist eine natürliche Zahl in 1..100,A
ist 'x
ist eine gerade Zahl'B
ist 'x
ist teilbar durch 10'wir haben dann:
P(A)
ist 0,5P(B)
ist 0,1Wenn wir wissen, dass
x
das durch 10 teilbar ist (dh inx
istB
), wissen wir, dass es auch eine gerade Zahl ist (dh inx
istA
)P(A|B) = 1
.Nach der Bayes-Regel haben wir:
x
x
Für ein nicht entartetes Beispiel betrachten wir zB
A
ist 'x
durch 7 teilbar' undB
ist 'x
durch 3 teilbar'. IstP(A|B)
dann gleichbedeutend mit 'vorausgesetzt, wir wissen, dassx
das durch 3 teilbar ist, wie groß ist die Wahrscheinlichkeit, dass es (auch) durch 7 teilbar ist?'. Oder gleichbedeutend mit 'Welcher Bruchteil der Zahlen 3, 6, ..., 99 ist durch 7 teilbar'?quelle
Ich denke, Ihre erste Aussage könnte ein Missverständnis sein.
Sie schrieben:
Nach Ihrer Formulierung klingt es möglicherweise so, als gäbe es zwei Ereignisse: "Zuerst ist B passiert, und dann möchten wir die Wahrscheinlichkeit berechnen, mit der A eintreten wird."
Das ist nicht der Fall. (Folgendes ist gültig, wenn ein Missverständnis vorliegt oder nicht).
Wir haben nur 1 Veranstaltung, die durch eine von 4 Möglichkeiten beschrieben wird:
quelle
Die Konditionierungswahrscheinlichkeit ist NICHT gleich der Schnittwahrscheinlichkeit. Hier ist eine intuitive Antwort:
Ausgehend von der Wahrscheinlichkeit des zweiten können wir die Wahrscheinlichkeit des ersten ableiten.
Es stellt sich heraus, dass beide Situationen gleichermaßen vorkommen. (Ich kann den intuitiven Grund nicht selbst herausfinden). Wir müssen also beide Szenarien mit gewichten0.5
Tadaaa ... jetzt isoliere die Wahrscheinlichkeit der Konditionierung!
btw. Ich würde mich freuen, wenn jemand erklären könnte, warum Szenario 1 und 2 gleich sind. Der Schlüssel liegt da imo.
quelle