Es gibt eine Person hinter einem Vorhang - ich weiß nicht, ob die Person weiblich oder männlich ist.
Ich weiß, dass die Person lange Haare hat und dass 90% aller Menschen mit langen Haaren weiblich sind
Ich weiß, dass die Person eine seltene Blutgruppe AX3 hat und dass 80% aller Menschen mit dieser Blutgruppe weiblich sind.
Wie groß ist die Wahrscheinlichkeit, dass die Person weiblich ist?
HINWEIS: Diese ursprüngliche Formulierung wurde um zwei weitere Annahmen erweitert: 1. Blutgruppe und Haarlänge sind unabhängig. 2. Das Verhältnis Mann: Frau in der Gesamtbevölkerung beträgt 50:50
(Das spezifische Szenario hier ist nicht so relevant - vielmehr habe ich ein dringendes Projekt, bei dem ich mich um den richtigen Ansatz für die Beantwortung dieser Frage kümmern muss. Mein Bauchgefühl ist, dass es sich eher um eine Frage der einfachen Wahrscheinlichkeit mit einer einfachen endgültigen Antwort handelt als etwas mit mehreren umstrittenen Antworten nach verschiedenen statistischen Theorien.)
quelle
Antworten:
Viele Menschen finden es hilfreich, in Begriffen wie "Bevölkerung", Untergruppen darin und Proportionen (anstatt Wahrscheinlichkeiten) zu denken . Dies eignet sich für visuelles Denken.
Ich werde die Zahlen im Detail erläutern, aber ein schneller Vergleich der beiden Zahlen soll sofort und überzeugend zeigen, wie und warum keine konkrete Antwort auf die Frage gegeben werden kann. Eine etwas längere Untersuchung legt nahe, welche zusätzlichen Informationen zur Bestimmung einer Antwort oder zumindest zur Ermittlung von Grenzen für die Antworten nützlich wären.
Legende
Kreuzschraffur : weiblich / Fester Hintergrund : männlich.
Oben langhaarig, unten kurzhaarig.
Rechts (und farbig) : AX3 / Links (ungefärbt) : Nicht-AX3.
Daten
Die obere Schraffur macht 90% des oberen Rechtecks aus ("90% aller Menschen mit langen Haaren sind weiblich").
Die gesamte Schraffur im rechten farbigen Rechteck macht 80% dieses Rechtecks aus ("80% aller Menschen mit dieser Blutgruppe sind weiblich.")
Erläuterung
Dieses Diagramm zeigt schematisch, wie die Population (aller betrachteten Frauen und Nicht-Frauen) gleichzeitig in Frauen / Nicht-Frauen, AX3 / Nicht-AX3 und Langhaar / Nicht-Langhaar ("kurz") aufgeteilt werden kann. Zumindest annähernd wird die Fläche verwendet, um Proportionen darzustellen (es gibt einige Übertreibungen, um das Bild klarer zu machen).
Es ist offensichtlich, dass diese drei binären Klassifikationen acht mögliche Gruppen erzeugen. Jede Gruppe erscheint hier.
Die angegebenen Informationen besagen, dass das obere schraffierte Rechteck (langhaarige Frauen) 90% des oberen Rechtecks ausmacht (alle langhaarigen Personen). Es heißt auch, dass die kombinierten schraffierten Teile der farbigen Rechtecke (langhaarige Frauen mit AX3 und kurzhaarige Frauen mit AX3) 80% der farbigen Region auf der rechten Seite ausmachen (alle Menschen mit AX3). Uns wird gesagt, dass jemand in der oberen rechten Ecke liegt (Pfeil): Langhaarige mit AX3. Welcher Anteil dieses Rechtecks ist schraffiert (weiblich)?
Ich habe auch (implizit) angenommen, dass Blutgruppe und Haarlänge unabhängig sind : Der Anteil des oberen Rechtecks (langes Haar), das gefärbt ist (AX3), entspricht dem Anteil des unteren Rechtecks (kurzes Haar), das gefärbt ist (AX3). Das bedeutet Unabhängigkeit. Es ist eine faire und natürliche Annahme, solche Fragen anzusprechen, aber natürlich muss dies angegeben werden.
Die Position des oberen schraffierten Rechtecks (langhaarige Frauen) ist unbekannt. Wir können uns vorstellen, das obere schraffierte Rechteck von Seite zu Seite zu schieben und das untere schraffierte Rechteck von Seite zu Seite zu schieben und möglicherweise seine Breite zu ändern. Wenn wir dies tun, damit 80% des farbigen Rechtecks schraffiert bleiben, ändert eine solche Änderung keine der angegebenen Informationen, kann jedoch den Anteil der Frauen im oberen rechten Rechteck ändern. Offensichtlich könnte der Anteil irgendwo zwischen 0% und 100% liegen und dennoch mit den angegebenen Informationen übereinstimmen, wie in diesem Bild:
Eine Stärke dieser Methode besteht darin, dass es mehrere Antworten auf die Frage gibt. All dies könnte man algebraisch übersetzen und mittels der Festlegung von Wahrscheinlichkeiten konkrete Situationen als mögliche Beispiele anbieten, aber dann stellt sich die Frage, ob solche Beispiele wirklich mit den Daten übereinstimmen. Wenn zum Beispiel jemand vorschlägt, dass vielleicht 50% der Langhaarigen AX3 sind, ist zu Beginn nicht ersichtlich, dass dies bei allen verfügbaren Informationen überhaupt möglich ist. Diese (Venn-) Diagramme der Bevölkerung und ihrer Untergruppen machen dies deutlich.
quelle
Dies ist eine Frage der bedingten Wahrscheinlichkeit. Sie wissen, dass die Person lange Haare und Blutgruppe Ax3 hat. Lassen Sie Also suchst du . Sie wissen, dass und . Reicht das aus, um zu berechnenP ( C | A und B ) , P ( C | A ) = 0,9 P ( C | B ) = 0,8 P ( C | A und B ) ? Angenommen, P ( A und B und C ) = 0,7 . Dann P ( C | A und B
Jetzt sind beide möglich, wenn und P ( C | B ) = 0,8 ist . Wir können also nicht genau sagen, was P ( C | A und B ) ist.P(C|A)=0.9 P( C| B)=0,8 P( C| AundB)
quelle
Faszinierende Diskussion! Ich frage mich, ob wir P (A) und P (B) auch spezifiziert haben, ob die Bereiche von P (C | A, B) nicht viel enger als das volle Intervall [0,1] sein werden, einfach wegen der vielen Einschränkungen wir haben.
Halten Sie sich an die oben eingeführte Notation:
A = der Fall, dass die Person lange Haare hat
B = das Ereignis, dass die Person die Blutgruppe AX3 hat
C = das Ereignis, dass diese Person weiblich ist
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (dh nehmen wir ein gleiches Verhältnis von Männern und Frauen in der Gesamtbevölkerung an)
dann
4. (trivial) Das obere Rechteck kann nicht über die linke Grenze hinaus verschoben werden und sollte nicht über seine minimale Überlappung nach links hinaus verschoben werden.
5. (trivial) Das untere Rechteck kann nicht über die rechte Grenze hinaus verschoben werden und sollte nicht über seine maximale Überlappung nach rechts hinaus verschoben werden.
Durch Durchlaufen eines Bereichs möglicher Werte für P (A) und P (B) ( R-Skript ) wird dieses Diagramm generiert
Abschließend können wir die bedingte Wahrscheinlichkeit P (c | A, B) für gegebene P (A), P (B) senken
quelle
Die Hypothese lautet, dass die Person hinter einem Vorhang eine Frau ist.
Wir haben 2 Beweise vorgelegt, nämlich:
Beweis 1: Wir wissen, dass die Person lange Haare hat (und uns wurde gesagt, dass 90% aller Menschen mit langen Haaren weiblich sind)
Beweis 2: Wir wissen, dass die Person eine seltene Blutgruppe AX3 hat (und es wird berichtet, dass 80% aller Menschen mit dieser Blutgruppe weiblich sind)
Ausgehend von Beweis 1 können wir sagen, dass die Person hinter einem Vorhang mit einer Wahrscheinlichkeit von 0,9 eine Frau ist (unter der Annahme einer Aufteilung von 50:50 zwischen Männern und Frauen).
In Bezug auf die Frage, die zuvor im Thread gestellt wurde, nämlich "Würden Sie zustimmen, dass die Antwort GRÖSSER als 0,9 sein muss?", Würde ich intuitiv sagen, dass die Antwort "Ja" sein muss (sie ist GRÖSSER als 0,9). Die Logik ist, dass Evidence 2 Beweise stützt (wiederum unter der Annahme eines 50: 50-Spalts für die Anzahl der Männer und Frauen in der Welt). Wenn wir erfahren würden, dass 50% aller Menschen mit AX3-Blut weiblich sind, wäre Evidence 2 neutral und ohne Bedeutung. Aber da uns gesagt wird, dass 80% aller Menschen mit dieser Blutgruppe weiblich sind, stützt Evidence 2 Beweise und sollte logischerweise die endgültige Wahrscheinlichkeit einer Frau über 0,9 hinausschieben.
Um eine bestimmte Wahrscheinlichkeit zu berechnen, können wir die Bayes-Regel für Evidence 1 anwenden und dann die Bayes-Aktualisierung verwenden, um Evidence 2 auf die neue Hypothese anzuwenden.
Annehmen:
A = der Fall, dass die Person lange Haare hat
B = das Ereignis, dass die Person die Blutgruppe AX3 hat
C = das Ereignis, dass die Person weiblich ist (50% annehmen)
Anwenden der Bayes-Regel auf Beweis 1:
P (C | A) = (P (A | C) · P (C)) / P (A)
Auch in diesem Fall, wenn wir eine Aufteilung von 50:50 zwischen Männern und Frauen annehmen:
P (A) = (0,5 × 0,9) + (0,5 × 0,1) = 0,5
Also, P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (Nicht überraschend, aber es wäre anders, wenn wir nicht eine Aufteilung von 50:50 zwischen Männern und Frauen hätten.)
Unter Verwendung der Bayes'schen Aktualisierung, um Evidence 2 anzuwenden und 0.9 als neue vorherige Wahrscheinlichkeit einzufügen, haben wir:
P (C | A UND B) = (P (B | C) * 0,9) / P (E)
Hier ist P (E) die Wahrscheinlichkeit für Evidenz 2 unter der Annahme, dass die Person bereits eine 90% ige Chance hat, weiblich zu sein.
P (E) = (0,9 * 0,8) + (0,1 * 0,2) [Dies ist das Gesetz der Gesamtwahrscheinlichkeit: (P (Frau) * P (AX3 | Frau) + P (Mann) * P (AX3 | Mann)] Also , P (E) = 0,74
Also ist P (C | A UND B) = (0,8 × 0,9) / 0,74 = 0,97297
quelle
Fragenanpassung und Verallgemeinerung
Antworten
Fall 1
Es wurde durch verschiedene esoterische Mittel gezeigt, dass die zuzuweisende Verteilung, wenn die Informationen keine andere Lösung bestimmen, diejenige ist, die von allen mit den bekannten Informationen konsistenten Verteilungen die größte Entropie aufweist. Jede andere Verbreitung impliziert, dass wir mehr wissen als die bekannten Informationen, was natürlich ein Widerspruch ist.
Fall 2
Fall 3
Fall 4
quelle
Ich glaube jetzt, dass, wenn wir ein Verhältnis von Männern und Frauen in der Gesamtbevölkerung annehmen, es eine einzige unbestreitbare Antwort gibt.
A = der Fall, dass die Person lange Haare hat
B = das Ereignis, dass die Person die Blutgruppe AX3 hat
C = das Ereignis, dass diese Person weiblich ist
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (dh nehmen wir ein gleiches Verhältnis von Männern und Frauen in der Gesamtbevölkerung an)
Dann ist P (C | A und B) = [P (C | A) × P (C | B) / P (C)] / [P (C | A) × P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]
in diesem Fall ist P (C | A und B) = 0,972973
quelle
Hinweis: Um eine endgültige Antwort zu erhalten, gehen die folgenden Antworten davon aus, dass die Wahrscheinlichkeit, dass eine Person, ein langhaariger Mann und eine langhaarige Frau AX3 haben, ungefähr gleich ist. Wenn mehr Genauigkeit gewünscht wird, sollte dies überprüft werden.
Sie beginnen mit dem Wissen, dass die Person lange Haare hat. Zu diesem Zeitpunkt sind die Chancen also:
Hinweis:
Das Verhältnis von Männern zu Frauen in der Allgemeinbevölkerung spielt für uns keine Rolle, sobald wir feststellen, dass die Person lange Haare hat. Wenn zum Beispiel 1 von 100 Frauen in der Allgemeinbevölkerung leben würde, wäre eine zufällig ausgewählte langhaarige Person immer noch zu 90% weiblich.Das Verhältnis von Frauen zu Männern spielt eine Rolle! (Einzelheiten finden Sie im Update weiter unten.)Als nächstes erfahren wir, dass die Person AX3 hat. Da AX3 nichts mit langen Haaren zu tun hat, beträgt das Verhältnis von Männern zu Frauen bekanntermaßen 50:50. Da wir davon ausgehen, dass die Wahrscheinlichkeiten gleich sind, können wir einfach jede Seite der Wahrscheinlichkeit multiplizieren und so normalisieren, dass sich die Summe aus ergibt Die Seiten der Wahrscheinlichkeit sind gleich 100:
Somit liegt die Wahrscheinlichkeit, dass die Person hinter dem Vorhang weiblich ist, bei etwa 97,297%.
AKTUALISIEREN
Hier ist eine weitere Untersuchung des Problems:
Definitionen:
Zunächst wird uns mitgeteilt, dass 90% der langhaarigen Menschen weiblich sind und 80% der Menschen mit AX3 weiblich.
Da wir davon ausgegangen sind, dass die Wahrscheinlichkeit von AX3 unabhängig von Geschlecht und langem Haar ist, gilt unser berechneter pfx für Frauen mit langem Haar, und pmx gilt für Männer mit langem Haar, um die Anzahl von ihnen zu ermitteln, die wahrscheinlich AX3 haben:
Somit ist das wahrscheinliche Verhältnis der Anzahl von Frauen mit langen Haaren und AX3 zur Anzahl von Männern mit langen Haaren und AX3:
Da vorausgesetzt wird, dass es eine gleiche Anzahl von 50:50 gibt, können Sie beide Seiten stornieren und mit 36 Frauen für jeden Mann enden. Ansonsten gibt es 36 * m / w Frauen für jeden Mann in der angegebenen Untergruppe. Wenn es beispielsweise doppelt so viele Frauen wie Männer gäbe, würde jeder Mann mit langen Haaren und AX3 72 Frauen haben.
quelle
98% weiblich, einfache Interpolation. Erste Prämisse 90% weiblich, verlässt 10%, zweite Prämisse verlässt nur 2% der bestehenden 10%, also 98% weiblich
quelle