Interpretation des Bayes-Theorems für positive Mammographieergebnisse

11

Ich versuche, mich mit dem Ergebnis des Bayes-Theorems zu beschäftigen, das auf das klassische Mammogramm-Beispiel angewendet wurde, wobei die Drehung des Mammogramms perfekt ist.

Das ist,

Inzidenz von Krebs: $.01$

Wahrscheinlichkeit einer positiven Mammographie bei Krebs des Patienten: $1$

Wahrscheinlichkeit einer positiven Mammographie, wenn der Patient keinen Krebs hat: $.01$

Von Bayes:

P (Krebs | Mammogramm +) = $\dfrac {1 \cdot .01}{(1 \cdot .01) + (.091 \cdot .99)}$

$= .5025$

Wenn also eine zufällige Person aus der Bevölkerung die Mammographie macht und ein positives Ergebnis erzielt, besteht eine 50% ige Wahrscheinlichkeit, dass sie Krebs hat? Ich verstehe nicht intuitiv, wie die winzige 1% ige Wahrscheinlichkeit eines falsch positiven Ergebnisses bei 1% der Bevölkerung ein 50% iges Ergebnis auslösen kann. Logischerweise würde ich denken, dass ein vollkommen wahres positives Mammogramm mit einer winzigen falsch positiven Rate viel genauer wäre.

bayesian bayes binning diagnosis user2666425
quelle

2

Die Falsch-Positiv-Rate liegt nicht bei 1%, sondern bei 99% der Bevölkerung. Aus diesem Grund erhalten Sie eine Wahrscheinlichkeit, die aufgrund der sehr hohen vorherigen Wahrscheinlichkeit, dass jemand gesund ist, gering erscheint. Denken Sie auch daran, dass dies nur ein einziger Test ist. Was passiert, wenn Sie den Test mehrmals durchführen? Dann spielt die Genauigkeit des Tests eine größere Rolle.

Dsaxton

Wenn es sich um ein perfektes Mammogramm handelt, ist die Falsch-Positiv-Rate Null und dann ist p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0, wenn sich die Falsch-Positiv-Rate des Mammogramms nähert Perfektion (0), dann nähert sich der zweite Term unten Null. Die 'winzige' Falsch-Positiv-Rate kombiniert mit der ähnlich winzigen Basisrate das kontraintuitive Ergebnis.

Dave X

Meine Erfahrung zeigt, dass Logik der formalen deduktiven Art eine wunderbare Sache ist, aber äußerst schlechte Intuitionen über probabilistische Folgerungen erzeugt. Die Tools hier bmj.com/content/343/bmj.d6386 können Ihrer Intuition helfen.

Conjugateprior

Nach meinem Verständnis fragt die Frage nach der Intuition, wie die bedingte Wahrscheinlichkeit angesichts der Annahmen so gering sein kann. nicht über tatsächliche Mammographiestatistiken im wirklichen Leben (worum es in den Antworten zu gehen scheint).

Juho Kokkala

Ich denke, es gibt einen Tippfehler im Nenner (2. Term sollte (.01 * 0.99) sein? Das Ergebnis ist jedoch korrekt. Nicht wirklich eine Intuition, aber vereinfachend haben Sie P (C | +) = P (C) / (P (C)). + (P (+ |! C) P (! C)) und P (C) sind sehr niedrig. Daher ist P (C | +) äußerst empfindlich gegenüber P (+ |! C), dh Sie benötigen P ( + |! C) << P (C), damit P (C | +) sich 1 nähert

David Waterworth

11

Ich werde diese Frage sowohl aus medizinischer als auch aus statistischer Sicht beantworten. Es hat in der Laienpresse viel Aufmerksamkeit erhalten, insbesondere nach dem Bestseller The Signal und The Noise von Nate Silver sowie einer Reihe von Artikeln in Veröffentlichungen wie der New York Times denen das Konzept erläutert wird. Daher bin ich sehr froh, dass @ user2666425 dieses Thema im Lebenslauf geöffnet hat.

Lassen Sie mich zunächst klarstellen, dass die $p\,(+|C) = 1$ $20\%$ $0.8$ $1$ ist bei einem Screening-Test kritisch.

$\small p(C|+) = \large \frac{p(+|C)}{p(+)}\small* p(C)$

$\sim 1.5\%$
$7 - 10\%$ $1\%$

Neuberechnung und vor allem für jüngere Frauen ohne Risikofaktoren :

$p(C|+) = \frac{p(+|C)}{p(+)}\small* p(C) =$

$= \frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \large \frac{0.8}{0.8*0.015\, +\, 0.07*0.985}\small*\, 0.015 = 0.148$

$15\%$

$40$ $45$ .

Bei älteren Frauen steigt die Prävalenz (und damit die Wahrscheinlichkeit vor dem Test) linear mit dem Alter an. Laut dem aktuellen Bericht ist das Risiko, dass bei einer Frau in den nächsten 10 Jahren ab dem folgenden Alter Brustkrebs diagnostiziert wird, wie folgt:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

$10\%$

$4\%$

$p(C|+)=\large \frac{0.8}{0.8*0.04\, +\, 0.07*0.96}\small*\, 0.04 = 0.32 \sim 32\%$

$p(C|+)$

Spezifische Antwort auf Ihre Frage:

$p(+|\bar C)$ $7-10\%$ $1\%$ $p(\bar C)$ Beachten Sie, dass diese "Fehlalarmrate" mit dem viel größeren Anteil krebsfreier Fälle (im Vergleich zu Krebspatienten) im Nenner multipliziert wird, nicht mit der "winzigen 1% igen Wahrscheinlichkeit eines Fehlalarms bei 1% der Bevölkerung" erwähnen. Ich glaube, das ist die Antwort auf Ihre Frage. Hervorheben, obwohl dies in einem diagnostischen Test nicht akzeptabel wäre, lohnt es sich dennoch in einem Screening-Verfahren.

Intuitionsproblem: @Juho Kokkala sprach das Problem an, das das OP nach der Intuition fragte . Ich dachte, es wäre in den Berechnungen und den abschließenden Absätzen impliziert, aber fair genug ... So würde ich es einem Freund erklären ... Stellen wir uns vor, wir gehen mit einem Metalldetektor in Winslow, Arizona, auf die Suche nach Meteorfragmenten. Genau hier:

Bild von meteorcrater.com

... und der Metalldetektor geht aus. Wenn Sie sagen würden, dass die Wahrscheinlichkeit besteht, dass ein Tourist eine Münze abgegeben hat, haben Sie wahrscheinlich Recht. Aber Sie verstehen: Wenn der Ort nicht so gründlich untersucht worden wäre, wäre es viel wahrscheinlicher, dass ein Piepton des Detektors an einem Ort wie diesem von einem Meteoritenfragment kam, als wenn wir auf den Straßen von NYC wären.

Was wir mit der Mammographie machen, ist, dass eine gesunde Bevölkerung nach einer stillen Krankheit sucht, die tödlich sein kann, wenn sie nicht früh erkannt wird. Glücklicherweise ist die Prävalenz (obwohl sie im Vergleich zu anderen weniger heilbaren Krebsarten sehr hoch ist) niedrig genug, dass die Wahrscheinlichkeit, zufällig auf Krebs zu stoßen, gering ist, selbst wenn die Ergebnisse "positiv" sind , insbesondere bei jungen Frauen.

$p(\bar C|+)=0$

$\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \frac{p(+|C)}{p(+|C)\,*\,p(C)}\small* p(C) = 1$ $100\%$

$\frac{\text{likelihood}}{\text{unconditional p(+)}}=\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}$ $<1$ $p(C)$ $\text{posterior} = \alpha * \text{prior}$ $\text{posterior} < \text{prior}$ Positiver Vorhersagewert (PPV) : Wahrscheinlichkeit, dass Probanden mit einem positiven Screening-Test tatsächlich an der Krankheit leiden.

Antoni Parellada
quelle

5

Ein Schlüsselproblem bei der Mammographie, das im Diskurs nicht angemessen behandelt wurde, ist die fehlerhafte Definition von "positiv". Dies wird im Kapitel Diagnose unter http://biostat.mc.vanderbilt.edu/ClinStat beschrieben - siehe dort den Link für Biostatistik in der biomedizinischen Forschung .

Eines der am häufigsten verwendeten diagnostischen Codierungssysteme in der Mammographie ist der BI-RADS-Score, und ein Score von 4 ist ein häufiges "positives" Ergebnis. Die Definition der Kategorie 4 lautet "Nicht charakteristisch für Brustkrebs, aber angemessene Wahrscheinlichkeit, bösartig zu sein (3 bis 94%); eine Biopsie sollte in Betracht gezogen werden." Bei einem Risikobereich von 0,03 bis 0,94 für eine Kategorie , dh einer unglaublichen Heterogenität in Bezug auf das, was "positiv" wirklich bedeutet, ist es kein Wunder, dass wir ein Durcheinander in den Händen haben.

Es ist auch ein Zeichen unklarer Überlegungen, dass das BI-RADS-System keine Kategorie für jemanden mit einem geschätzten Risiko von 0,945 hat.

Wie Nate Silver in The Signal and the Noise so eloquent argumentiert , würden wir, wenn wir probabilistisch denken würden, überall bessere Entscheidungen treffen. Das Entfernen von Begriffen wie "positiv" und "negativ" für medizinische Tests würde falsch positive und falsch negative Ergebnisse entfernen und Unsicherheit (und Rechtfertigung für weitere Tests vor der Diagnose) optimal vermitteln.

Frank Harrell
quelle

Wir haben praktisch synchron geschrieben - lesen Sie meine Kommentare zu BI-RADS. Ich konnte nicht mehr zustimmen (jede Menge persönliche Erfahrung als Radiologe).

Antoni Parellada

3

Eine schöne Diskussion darüber gibt es in dem Buch Calculated Risks

In einem Großteil des Buches geht es darum, klarere Wege zu finden, um über Wahrscheinlichkeit und Risiko zu sprechen und darüber nachzudenken. Ein Beispiel:

Die Wahrscheinlichkeit, dass eine Frau im Alter von 40 Jahren an Brustkrebs leidet, liegt bei etwa 1 Prozent. Wenn sie Brustkrebs hat, liegt die Wahrscheinlichkeit, dass sie in einem Screening-Mammogramm positiv getestet wird, bei etwa 90 Prozent. Wenn sie keinen Brustkrebs hat, beträgt die Wahrscheinlichkeit, dass sie trotzdem positiv getestet wird, 9 Prozent. Wie hoch sind die Chancen, dass eine Frau, die positiv testet, tatsächlich Brustkrebs hat?

Auf diese Weise präsentiert das Buch die Lösung unter Verwendung von "Eigenfrequenzen". Betrachten Sie 10.000 Frauen, 1% haben Krebs, das sind 100 Frauen. Von diesen geben 90% positive Tests zurück (dh 90 Frauen mit Krebs werden positiv getestet). Von den 9900 ohne Krebs geben 9% einen positiven Test oder 891 Frauen zurück. Es gibt also 891 + 90 = 981 Frauen mit positiven Tests, von denen 90 Krebs haben. Die Wahrscheinlichkeit, dass eine Frau mit einem positiven Test Krebs hat, beträgt 90/981 = 0,092

Wenn 100% der krebskranken Frauen positiv sind, ändert sich die Zahl nur ein wenig auf 100 / (100 + 891) = 0,1

Tony Ladson
quelle

1

Vielleicht ist diese Denkweise richtig?:

$.01 * 1$

$0.0025$

user2666425
quelle

1

Hier ist eine vereinfachte, aber intuitive Sichtweise. Betrachten Sie 100 Personen. Man hat Krebs und wird positiv testen. Von den 99, die dies nicht tun, wird einer einen falsch positiven Test erhalten. Von den beiden positiven wird einer Krebs haben und einer nicht.

Emil Friedman
quelle

Interpretation des Bayes-Theorems für positive Mammographieergebnisse

Antworten: