Ich versuche, mich mit dem Ergebnis des Bayes-Theorems zu beschäftigen, das auf das klassische Mammogramm-Beispiel angewendet wurde, wobei die Drehung des Mammogramms perfekt ist.
Das ist,
Inzidenz von Krebs:
Wahrscheinlichkeit einer positiven Mammographie bei Krebs des Patienten:
Wahrscheinlichkeit einer positiven Mammographie, wenn der Patient keinen Krebs hat:
Von Bayes:
P (Krebs | Mammogramm +) =
Wenn also eine zufällige Person aus der Bevölkerung die Mammographie macht und ein positives Ergebnis erzielt, besteht eine 50% ige Wahrscheinlichkeit, dass sie Krebs hat? Ich verstehe nicht intuitiv, wie die winzige 1% ige Wahrscheinlichkeit eines falsch positiven Ergebnisses bei 1% der Bevölkerung ein 50% iges Ergebnis auslösen kann. Logischerweise würde ich denken, dass ein vollkommen wahres positives Mammogramm mit einer winzigen falsch positiven Rate viel genauer wäre.
Antworten:
Ich werde diese Frage sowohl aus medizinischer als auch aus statistischer Sicht beantworten. Es hat in der Laienpresse viel Aufmerksamkeit erhalten, insbesondere nach dem Bestseller The Signal und The Noise von Nate Silver sowie einer Reihe von Artikeln in Veröffentlichungen wie der New York Times denen das Konzept erläutert wird. Daher bin ich sehr froh, dass @ user2666425 dieses Thema im Lebenslauf geöffnet hat.
Lassen Sie mich zunächst klarstellen, dass diep(+|C)=1 20% 0.8 1 ist bei einem Screening-Test kritisch.
Neuberechnung und vor allem für jüngere Frauen ohne Risikofaktoren :
Bei älteren Frauen steigt die Prävalenz (und damit die Wahrscheinlichkeit vor dem Test) linear mit dem Alter an. Laut dem aktuellen Bericht ist das Risiko, dass bei einer Frau in den nächsten 10 Jahren ab dem folgenden Alter Brustkrebs diagnostiziert wird, wie folgt:
Spezifische Antwort auf Ihre Frage:
Intuitionsproblem: @Juho Kokkala sprach das Problem an, das das OP nach der Intuition fragte . Ich dachte, es wäre in den Berechnungen und den abschließenden Absätzen impliziert, aber fair genug ... So würde ich es einem Freund erklären ... Stellen wir uns vor, wir gehen mit einem Metalldetektor in Winslow, Arizona, auf die Suche nach Meteorfragmenten. Genau hier:
Bild von meteorcrater.com
... und der Metalldetektor geht aus. Wenn Sie sagen würden, dass die Wahrscheinlichkeit besteht, dass ein Tourist eine Münze abgegeben hat, haben Sie wahrscheinlich Recht. Aber Sie verstehen: Wenn der Ort nicht so gründlich untersucht worden wäre, wäre es viel wahrscheinlicher, dass ein Piepton des Detektors an einem Ort wie diesem von einem Meteoritenfragment kam, als wenn wir auf den Straßen von NYC wären.
Was wir mit der Mammographie machen, ist, dass eine gesunde Bevölkerung nach einer stillen Krankheit sucht, die tödlich sein kann, wenn sie nicht früh erkannt wird. Glücklicherweise ist die Prävalenz (obwohl sie im Vergleich zu anderen weniger heilbaren Krebsarten sehr hoch ist) niedrig genug, dass die Wahrscheinlichkeit, zufällig auf Krebs zu stoßen, gering ist, selbst wenn die Ergebnisse "positiv" sind , insbesondere bei jungen Frauen.
quelle
Ein Schlüsselproblem bei der Mammographie, das im Diskurs nicht angemessen behandelt wurde, ist die fehlerhafte Definition von "positiv". Dies wird im Kapitel Diagnose unter http://biostat.mc.vanderbilt.edu/ClinStat beschrieben - siehe dort den Link für Biostatistik in der biomedizinischen Forschung .
Eines der am häufigsten verwendeten diagnostischen Codierungssysteme in der Mammographie ist der BI-RADS-Score, und ein Score von 4 ist ein häufiges "positives" Ergebnis. Die Definition der Kategorie 4 lautet "Nicht charakteristisch für Brustkrebs, aber angemessene Wahrscheinlichkeit, bösartig zu sein (3 bis 94%); eine Biopsie sollte in Betracht gezogen werden." Bei einem Risikobereich von 0,03 bis 0,94 für eine Kategorie , dh einer unglaublichen Heterogenität in Bezug auf das, was "positiv" wirklich bedeutet, ist es kein Wunder, dass wir ein Durcheinander in den Händen haben.
Es ist auch ein Zeichen unklarer Überlegungen, dass das BI-RADS-System keine Kategorie für jemanden mit einem geschätzten Risiko von 0,945 hat.
Wie Nate Silver in The Signal and the Noise so eloquent argumentiert , würden wir, wenn wir probabilistisch denken würden, überall bessere Entscheidungen treffen. Das Entfernen von Begriffen wie "positiv" und "negativ" für medizinische Tests würde falsch positive und falsch negative Ergebnisse entfernen und Unsicherheit (und Rechtfertigung für weitere Tests vor der Diagnose) optimal vermitteln.
quelle
Eine schöne Diskussion darüber gibt es in dem Buch Calculated Risks
In einem Großteil des Buches geht es darum, klarere Wege zu finden, um über Wahrscheinlichkeit und Risiko zu sprechen und darüber nachzudenken. Ein Beispiel:
Die Wahrscheinlichkeit, dass eine Frau im Alter von 40 Jahren an Brustkrebs leidet, liegt bei etwa 1 Prozent. Wenn sie Brustkrebs hat, liegt die Wahrscheinlichkeit, dass sie in einem Screening-Mammogramm positiv getestet wird, bei etwa 90 Prozent. Wenn sie keinen Brustkrebs hat, beträgt die Wahrscheinlichkeit, dass sie trotzdem positiv getestet wird, 9 Prozent. Wie hoch sind die Chancen, dass eine Frau, die positiv testet, tatsächlich Brustkrebs hat?
Auf diese Weise präsentiert das Buch die Lösung unter Verwendung von "Eigenfrequenzen". Betrachten Sie 10.000 Frauen, 1% haben Krebs, das sind 100 Frauen. Von diesen geben 90% positive Tests zurück (dh 90 Frauen mit Krebs werden positiv getestet). Von den 9900 ohne Krebs geben 9% einen positiven Test oder 891 Frauen zurück. Es gibt also 891 + 90 = 981 Frauen mit positiven Tests, von denen 90 Krebs haben. Die Wahrscheinlichkeit, dass eine Frau mit einem positiven Test Krebs hat, beträgt 90/981 = 0,092
Wenn 100% der krebskranken Frauen positiv sind, ändert sich die Zahl nur ein wenig auf 100 / (100 + 891) = 0,1
quelle
Vielleicht ist diese Denkweise richtig?:
quelle
Hier ist eine vereinfachte, aber intuitive Sichtweise. Betrachten Sie 100 Personen. Man hat Krebs und wird positiv testen. Von den 99, die dies nicht tun, wird einer einen falsch positiven Test erhalten. Von den beiden positiven wird einer Krebs haben und einer nicht.
quelle