Warum versuchen die meisten veröffentlichten Arbeiten in der medizinischen Bildgebung, falsch positive Ergebnisse zu reduzieren?

20

In der medizinischen Bildverarbeitung versuchen die meisten veröffentlichten Arbeiten, die Falsch-Positiv-Rate (FPR) zu verringern, während Falsch-Negative in Wirklichkeit gefährlicher sind als Falsch-Positive. Was ist das Grundprinzip dahinter?

Hunar A.Ahmed
quelle
1
Aus der Sicht von en.wikipedia.org/wiki/Primum_non_nocere könnten falsche Positive als gefährlichere Fehler angesehen werden, noch bevor der Unterschied in absoluten Zahlen berücksichtigt wird, auf den Dragon richtig hinweist.
25.

Antworten:

29

TL; DR: Krankheiten sind selten, daher ist die absolute Anzahl der falsch-positiven weitaus höher als die der falsch-negativen.

Nehmen wir an, dass unser System die gleiche Rate falsch-positiver und falsch-negativer Krebserkrankungen von 1% aufweist (ziemlich gut!), Und dass wir in diesem Jahr das Auftreten neuer Krebserkrankungen feststellen: 439,2 / 100.000 Menschen oder 0,5% der Bevölkerung. [ Quelle ]

  • Kein Krebs, kein Nachweis: 99,5% x 99% = 98,5% (98,505%)
  • Kein Krebs, Nachweis: 99,5% x 1% = 1,0% (0,995%)
  • Krebs, Erkennung: 0,5% x 99% = 0,5% (0,495%)
  • Krebs, keine Erkennung: 0,5% x 1% = 0,005%

Wir sehen also, dass wir ein Problem haben: Für alle, die Krebs haben, kommen zwei Menschen, die keinen Krebs haben, mit invasiven Eingriffen, Chemotherapie oder Strahlentherapie.

Für jede Person, bei der kein vorhandener Krebs erkannt wird, erhalten zweihundert Personen eine aktiv schädliche Behandlung, die sie nicht benötigen und sich nicht wirklich leisten können.

Drachen
quelle
1
Für viele Screening-Anwendungen ist die Inzidenz (keine neu diagnostizierte Krankheit pro 100000 Einwohner) sogar noch geringer: Die 0,5% entsprechen der Gesamtkrebsinzidenz, wohingegen Screening-Programme auf bestimmte Krebsarten abzielen.
cbeleites unterstützt Monica
6
@cbeleites, um ein konkretes Beispiel zu nennen, Pankreasadenokarzinom ist fast immer tödlich, weil es asymptomatisch ist, bis es ein fortgeschrittenes Stadium erreicht. Wenn Sie einen Screening-Test mit einer 1% falsch-positiven / 1% falsch-negativen Rate auf die gesamte Bevölkerung der Vereinigten Staaten anwenden würden, würden Sie ungefähr drei Millionen Fälle identifizieren, von denen nur 46.000 tatsächlich an Krebs erkranken, was positiv ist prädiktiver Wert von nur 1,5%.
Mark
2
Für die medizinische Bildgebung (zum Beispiel fMRI) kann das Problem durch die Tatsache verschärft werden, dass ein einzelnes Bild aus vielen "Voxeln" besteht, deren Aktivierung jeweils als Hypothese betrachtet wird - siehe zum Beispiel Zen und die Kunst des multiplen Vergleichs - Ich denke, das könnte es sein, worauf sich das OP bezieht
steeldriver
16

Sie kennen die Geschichte des Jungen, der Wolf geweint hat, oder?

Das ist die gleiche Idee. Nach so vielen Fehlalarmen (Schreien des Wolfes) durch einen Klassifikator wird dieser vom medizinischen Personal ausgeschaltet oder ignoriert.

"Oh, das schon wieder! NEIN!"

Zumindest bei der Bioengineering-Gruppe, mit der ich zusammengearbeitet habe, liegt der Schwerpunkt auf der Reduzierung der FPR, da das Ziel darin besteht, ein Tool zu entwickeln, das Ärzte auf potenzielle Pathologie aufmerksam macht, und sie haben uns mitgeteilt, dass sie ein Produkt ignorieren werden, das Wolf schreit zu viel.

Für ein Produkt, das Ärzten hilft, müssen wir an ihre Psychologie appellieren, trotz des berechtigten Arguments, dass das Fehlen des Wolfs auf der Farm schlimmer ist als das Weinen des Wolfs.

Bearbeiten : Falsch-Positive verringern hat auch ein legitimes Argument. Wenn Ihr Computer weiterhin Wolf weint, während Sie gelegentlich echte positive Ergebnisse erhalten (und die meisten echten positiven Ergebnisse abfangen), bedeutet dies effektiv, dass jemand krank sein könnte. Sie sind im Krankenhaus. Der Arzt weiß, dass der Patient krank sein könnte.

Dave
quelle
7

Zusammenfassung: Die Frage * ist wahrscheinlich nicht, ob ein falsches Negativ schlechter als ein falsches Positiv ist, sondern ob 500 falsche Positive akzeptabel sind, um ein falsches Negativ zu erhalten.

* hängt von der Anwendung ab


Lassen Sie mich die Antwort von @ Dragon etwas näher erläutern:

  • Screening bedeutet, dass wir in einer scheinbar gesunden Bevölkerung nach Krankheiten suchen. Wie @Dragon erklärte, benötigen wir für diese extrem niedrige FPR (oder hohe Empfindlichkeit), da wir sonst viel mehr falsch-positive als wahr-positive Ergebnisse erhalten. Dh, der positive Vorhersagewert (# wirklich krank unter allen diagnostizierten positiven) wäre inakzeptabel niedrig.

  • Empfindlichkeit (TPR) und Spezifität (TNR) sind für ein Diagnosesystem leicht zu messen: Nehmen Sie eine Reihe von wirklich (nicht) erkrankten Fällen und messen Sie den Anteil der richtig erkannten Fälle.

  • OTOH, sowohl aus Sicht der Ärzte als auch der Patienten, sind die prädikativen Werte mehr auf den Punkt. Sie sind das "Inverse" zu Sensitivität und Spezifität und sagen Ihnen unter allen positiven (negativen) Vorhersagen, welcher Bruch korrekt ist. Mit anderen Worten, nach dem Test sagte "Krankheit", was ist die Wahrscheinlichkeit, dass der Patient tatsächlich die Krankheit hat.

  • Wie @Dragon Ihnen gezeigt hat, spielt die Inzidenz (oder Prävalenz, je nachdem von welchem ​​Test wir sprechen) hier eine entscheidende Rolle. Die Inzidenz ist bei allen Arten von Screening- / Krebsfrüherkennungsanwendungen gering.
    Um dies zu verdeutlichen, hat das Ovarialkarzinom-Screening bei Frauen nach der Menopause eine Prävalenz von 0,04% in der Allgemeinbevölkerung und 0,5% bei Frauen mit hohem Risiko in der Familienanamnese und / oder bekannten Mutationen der Tumorsuppressorgene BRCA1 und 2 [Buchen, L. Krebs: Die Marke verfehlt. Nature, 2011, 471, 428-432]

  • Die Frage ist also in der Regel nicht, ob ein falsches Negativ schlechter ist als ein falsches Positiv, sondern ob sogar eine Spezifität von 99% (1% FPR) und eine Sensitivität von 95% (Zahlen aus dem oben verlinkten Papier) für jedes falsche Negativ ungefähr 500 falsch positive Ergebnisse bedeuten .

  • Denken Sie auch daran, dass die Krebsfrüherkennung an sich kein magisches Heilmittel für Krebs ist. ZB bei der Brustkrebsvorsorge-Mammographie profitieren nur 3 - 13% der wirklich positiven Patienten von der Vorsorge .
    Daher müssen wir auch die Anzahl der Fehlalarme für jeden begünstigten Patienten im Auge behalten . ZB für die Mammographie, zusammen mit diesen Zahlen , eine grobe Vermutung, dass wir irgendwo im Bereich von 400 - 1800 Falsch-Positiven pro wahrem Positiven (39 - 49 Jahre alte Gruppe) haben.

  • Mit Hunderten von falsch-positiven Ergebnissen pro falsch-negativem Ergebnis (und vielleicht auch Hunderten oder sogar Tausenden von falsch-positiven Ergebnissen pro Patient, die vom Screening profitieren) ist die Situation nicht so klar wie "Ist ein ausgelassener Krebs schlimmer als eine falsch-positive Krebsdiagnose": falsch-positive Ergebnisse Auswirkungen haben, die von psychisch und psychosomatisch (weil Sie befürchten, dass Krebs an sich nicht gesund ist) bis hin zu physischen Risiken von Folgediagnosen wie Biopsie (eine kleine Operation, die als solche ihre eigene hat) reichen Risiken).
    Selbst wenn die Auswirkung eines Fehlalarms gering ist, können sich die entsprechenden Risiken erheblich summieren, wenn Hunderte von Fehlalarmen berücksichtigt werden müssen.

    Literaturempfehlung: Gerd Gigerenzer: Risikobewusst: Wie man gute Entscheidungen trifft (2014).

  • Welche PPV- und NPV-Werte erforderlich sind, um einen diagnostischen Test sinnvoll zu gestalten, hängt jedoch stark von der Anwendung ab.
    Wie bereits erläutert, liegt der Schwerpunkt beim Screening auf der Früherkennung von Krebs in der Regel auf PPV, dh, Sie müssen sicherstellen, dass Sie nicht zu viel Schaden durch falsche Negative verursachen. Das Auffinden eines beträchtlichen Anteils (auch wenn nicht aller) der frühen Krebspatienten ist bereits eine Verbesserung gegenüber der Status quo ohne Screening.
    Der OTOH- HIV-Test bei Blutspenden befasst sich zunächst mit dem NPV (dh der Sicherstellung, dass das Blut HIV-frei ist). In einem zweiten (und dritten) Schritt werden dann die falsch positiven Ergebnisse durch weitere Tests reduziert, bevor Menschen mit (falsch) positiven HIV-Testergebnissen beunruhigt werden.

  • Last but not least gibt es auch medizinische Testanwendungen, bei denen die Inzidenzen oder Prävalenzen nicht so extrem sind wie beim Screening von nicht besonders risikoreichen Populationen, z. B. bei einigen Differenzialdiagnosen.

cbeleites unterstützt Monica
quelle
1
Das ist ein bisschen dicht; könnte Neuformatierung verwenden, um das Lesen zu erleichtern. Sieht nach einer guten Antwort aus, ist aber ohne viel Zeit schwer zu recherchieren.
bob
3

Aus persönlicher Sicht hat ein falsches Positiv einen höheren Einfluss auf die Lebensqualität des Patienten als ein falsches Negativ (zumindest in den meisten Anwendungen der medizinischen Bildverarbeitung. Hier geht es nicht um Laborergebnisse). .

Schauen wir uns ein konkretes Beispiel an: das Tumor-Screening .

Ein falsches Negativ bedeutet, dass ein Tumor im Frühstadium mehr Zeit hat, zu wachsen und sich zu bösartigem Krebs zu entwickeln. Insgesamt dauert dieser Vorgang lange und jedes nachfolgende Screening hat eine höhere Wahrscheinlichkeit, ihn zu erkennen, aber realistisch gesehen leidet die Langzeitgesundheit eines Patienten.

Darüber hinaus ist immer ein Mensch an der Diagnose beteiligt. Die medizinische Bildverarbeitung in ihrer derzeitigen technologischen Phase soll dem medizinischen Personal helfen und nicht ersetzen . Es wird oft gemeint, um auf Läsionen oder Veränderungen im Gewebe hinzuweisen, die so subtil sind, dass ein Mensch sie übersehen könnte. Es gibt keine Chance, dass ein Arzt einen Tumor im fortgeschrittenen Stadium übersieht. Sie brauchen dafür keine Bildverarbeitung.

In Bezug auf medizinische Verfahren besteht kein großer Unterschied zwischen der Entfernung eines Tumors im Frühstadium und einem Tumor, der etwas mehr Zeit zum Wachsen hatte, wenn ein Tumor vor dem nächsten Screening nicht funktionsunfähig wird. Die Menge des entfernten Gewebes ist größer, aber die Art der Operation ist oft dieselbe. (Dies setzt voraus, dass der Patient regelmäßige Gesundheitsuntersuchungen durchführt.)

Ein falsches Positiv hat viele Implikationen, die nicht alle direkt mit einer Krankheit zusammenhängen:

  • Zusätzliche Prozeduren. Nachdem ein Bildgebungsprozess ein positives Ergebnis erbracht hat, werden weitere Tests durchgeführt, für die Blut oder Gewebe entnommen werden (Biopsie). Objektiv wird der Körper des Patienten geschädigt, um das Bildgebungsergebnis überprüfen zu können.
  • Angst. Labortests brauchen Zeit. Die betroffene Person lebt oft mehrere Tage, manchmal Wochen, von Ungewissheit, ob es sich bei der Läsion um Krebs handelt oder nicht. Viele Menschen, die solch ein falsches Positiv erlebt haben, bezeichnen dieses Ereignis als "traumatisierend" und leiden seit langem unter gesundheitlichen Ängsten.
  • Zeitinvestition. Wenn die Überprüfung des Bildgebungsergebnisses durch Labortests oder ähnliches mehrere Untersuchungen erfordert, müssen Patient und Ärzte Zeit dafür investieren. Selbst wenn nur ein Test durchgeführt wird, sind mehrere Personen beteiligt, darunter Krankenschwestern, Ärzte und Labortechniker. In einer Zeit, in der die Ärzte chronisch überlastet sind, sollte dies nach Möglichkeit vermieden werden.
  • Unnötige Medikamente. Im schlimmsten Fall wird der Patient wegen einer Krankheit behandelt, die er nicht einmal hat, und sein Körper wird durch Nebenwirkungen von Medikamenten unnötig belastet.
  • Wirkungsverlust. Das medizinische Personal ignoriert echte positive Ergebnisse, wenn ein Eingriff zu viele falsche positive Ergebnisse liefert (wie in anderen Antworten erläutert).

Diese Risiko-Nutzen-Bewertung zeigt, dass ein falsches Negativ ein geringeres Risiko für einen Patienten beinhaltet als ein falsches Positiv. Daher ist die Priorität der Reduzierung von Fehlalarmen in der Regel höher.

Elmy
quelle
1

Die Zeit des Klinikers ist kostbar

Aus dem Bereich der Medizin haben Kliniker häufig eine Vielzahl von Krankheiten zu entdecken und zu diagnostizieren, und dies ist ein zeitaufwendiger Prozess. Ein Tool, das ein falsches Positiv darstellt (auch wenn es nur eine geringe Rate aufweist), ist weniger nützlich, da es nicht möglich ist, dieser Diagnose zu vertrauen. Dies bedeutet, dass jedes Mal, wenn diese Diagnose erstellt wird, eine Überprüfung erforderlich ist. Stellen Sie es sich wie das WebMD von Software vor - alles ist ein Zeichen von Krebs!

Ein Tool, das falsche Negative darstellt, aber immer echte Positive darstellt, ist weitaus nützlicher, da ein Kliniker keine Zeit damit verschwenden muss, die Diagnose noch einmal zu überprüfen oder zu erraten. Wenn es jemanden mit einer bestimmten Diagnose als krank kennzeichnet, ist die Arbeit erledigt. Ist dies nicht der Fall, erhalten die Personen, die nicht als krank markiert sind, trotzdem zusätzliche Tests.

Es ist besser, ein Tool zu haben, das sogar ein einzelnes Merkmal einer Krankheit genau identifizieren kann, als ein Tool, das möglicherweise mehrere Merkmale verfälscht.

SSight3
quelle
0

False Positive Rate (FPR), auch Falschalarmrate (FAR) genannt; Eine große False Positive Rate kann zu einer schlechten Leistung des medizinischen Bilderkennungssystems führen. Bei einem falsch positiven Ergebnis erhalten Sie ein positives Ergebnis für einen Test, wenn Sie ein negatives Ergebnis hätten erhalten sollen. Zum Beispiel ist ein Schwangerschaftstest positiv, wenn die Person tatsächlich nicht schwanger ist.

EricAtHaufe
quelle
4
Dies beantwortet die Frage nicht. OP fragt nicht, was falsch-positiv bedeutet, sondern warum es als wichtiger erachtet wird als falsch-negativ.
Llewellyn
0

Aller Wahrscheinlichkeit nach weiß jeder in diesem Thread bereits, dass dies ein Problem im Kern der Bayes'schen Analyse ist. Ich hoffe, dass dieser Kommentar nur zum Wohle künftiger Pilger, die False Positives für ein rein radiologisches Problem halten, eine etwas allgemeinere Perspektive bietet.

Richard Careaga
quelle