In der medizinischen Bildverarbeitung versuchen die meisten veröffentlichten Arbeiten, die Falsch-Positiv-Rate (FPR) zu verringern, während Falsch-Negative in Wirklichkeit gefährlicher sind als Falsch-Positive. Was ist das Grundprinzip dahinter?
image-classification
image-recognition
Hunar A.Ahmed
quelle
quelle
Antworten:
TL; DR: Krankheiten sind selten, daher ist die absolute Anzahl der falsch-positiven weitaus höher als die der falsch-negativen.
Nehmen wir an, dass unser System die gleiche Rate falsch-positiver und falsch-negativer Krebserkrankungen von 1% aufweist (ziemlich gut!), Und dass wir in diesem Jahr das Auftreten neuer Krebserkrankungen feststellen: 439,2 / 100.000 Menschen oder 0,5% der Bevölkerung. [ Quelle ]
Wir sehen also, dass wir ein Problem haben: Für alle, die Krebs haben, kommen zwei Menschen, die keinen Krebs haben, mit invasiven Eingriffen, Chemotherapie oder Strahlentherapie.
Für jede Person, bei der kein vorhandener Krebs erkannt wird, erhalten zweihundert Personen eine aktiv schädliche Behandlung, die sie nicht benötigen und sich nicht wirklich leisten können.
quelle
Sie kennen die Geschichte des Jungen, der Wolf geweint hat, oder?
Das ist die gleiche Idee. Nach so vielen Fehlalarmen (Schreien des Wolfes) durch einen Klassifikator wird dieser vom medizinischen Personal ausgeschaltet oder ignoriert.
"Oh, das schon wieder! NEIN!"
Zumindest bei der Bioengineering-Gruppe, mit der ich zusammengearbeitet habe, liegt der Schwerpunkt auf der Reduzierung der FPR, da das Ziel darin besteht, ein Tool zu entwickeln, das Ärzte auf potenzielle Pathologie aufmerksam macht, und sie haben uns mitgeteilt, dass sie ein Produkt ignorieren werden, das Wolf schreit zu viel.
Für ein Produkt, das Ärzten hilft, müssen wir an ihre Psychologie appellieren, trotz des berechtigten Arguments, dass das Fehlen des Wolfs auf der Farm schlimmer ist als das Weinen des Wolfs.
Bearbeiten : Falsch-Positive verringern hat auch ein legitimes Argument. Wenn Ihr Computer weiterhin Wolf weint, während Sie gelegentlich echte positive Ergebnisse erhalten (und die meisten echten positiven Ergebnisse abfangen), bedeutet dies effektiv, dass jemand krank sein könnte. Sie sind im Krankenhaus. Der Arzt weiß, dass der Patient krank sein könnte.
quelle
Zusammenfassung: Die Frage * ist wahrscheinlich nicht, ob ein falsches Negativ schlechter als ein falsches Positiv ist, sondern ob 500 falsche Positive akzeptabel sind, um ein falsches Negativ zu erhalten.
* hängt von der Anwendung ab
Lassen Sie mich die Antwort von @ Dragon etwas näher erläutern:
Screening bedeutet, dass wir in einer scheinbar gesunden Bevölkerung nach Krankheiten suchen. Wie @Dragon erklärte, benötigen wir für diese extrem niedrige FPR (oder hohe Empfindlichkeit), da wir sonst viel mehr falsch-positive als wahr-positive Ergebnisse erhalten. Dh, der positive Vorhersagewert (# wirklich krank unter allen diagnostizierten positiven) wäre inakzeptabel niedrig.
Empfindlichkeit (TPR) und Spezifität (TNR) sind für ein Diagnosesystem leicht zu messen: Nehmen Sie eine Reihe von wirklich (nicht) erkrankten Fällen und messen Sie den Anteil der richtig erkannten Fälle.
OTOH, sowohl aus Sicht der Ärzte als auch der Patienten, sind die prädikativen Werte mehr auf den Punkt. Sie sind das "Inverse" zu Sensitivität und Spezifität und sagen Ihnen unter allen positiven (negativen) Vorhersagen, welcher Bruch korrekt ist. Mit anderen Worten, nach dem Test sagte "Krankheit", was ist die Wahrscheinlichkeit, dass der Patient tatsächlich die Krankheit hat.
Wie @Dragon Ihnen gezeigt hat, spielt die Inzidenz (oder Prävalenz, je nachdem von welchem Test wir sprechen) hier eine entscheidende Rolle. Die Inzidenz ist bei allen Arten von Screening- / Krebsfrüherkennungsanwendungen gering.
Um dies zu verdeutlichen, hat das Ovarialkarzinom-Screening bei Frauen nach der Menopause eine Prävalenz von 0,04% in der Allgemeinbevölkerung und 0,5% bei Frauen mit hohem Risiko in der Familienanamnese und / oder bekannten Mutationen der Tumorsuppressorgene BRCA1 und 2 [Buchen, L. Krebs: Die Marke verfehlt. Nature, 2011, 471, 428-432]
Die Frage ist also in der Regel nicht, ob ein falsches Negativ schlechter ist als ein falsches Positiv, sondern ob sogar eine Spezifität von 99% (1% FPR) und eine Sensitivität von 95% (Zahlen aus dem oben verlinkten Papier) für jedes falsche Negativ ungefähr 500 falsch positive Ergebnisse bedeuten .
Denken Sie auch daran, dass die Krebsfrüherkennung an sich kein magisches Heilmittel für Krebs ist. ZB bei der Brustkrebsvorsorge-Mammographie profitieren nur 3 - 13% der wirklich positiven Patienten von der Vorsorge .
Daher müssen wir auch die Anzahl der Fehlalarme für jeden begünstigten Patienten im Auge behalten . ZB für die Mammographie, zusammen mit diesen Zahlen , eine grobe Vermutung, dass wir irgendwo im Bereich von 400 - 1800 Falsch-Positiven pro wahrem Positiven (39 - 49 Jahre alte Gruppe) haben.
Mit Hunderten von falsch-positiven Ergebnissen pro falsch-negativem Ergebnis (und vielleicht auch Hunderten oder sogar Tausenden von falsch-positiven Ergebnissen pro Patient, die vom Screening profitieren) ist die Situation nicht so klar wie "Ist ein ausgelassener Krebs schlimmer als eine falsch-positive Krebsdiagnose": falsch-positive Ergebnisse Auswirkungen haben, die von psychisch und psychosomatisch (weil Sie befürchten, dass Krebs an sich nicht gesund ist) bis hin zu physischen Risiken von Folgediagnosen wie Biopsie (eine kleine Operation, die als solche ihre eigene hat) reichen Risiken).
Selbst wenn die Auswirkung eines Fehlalarms gering ist, können sich die entsprechenden Risiken erheblich summieren, wenn Hunderte von Fehlalarmen berücksichtigt werden müssen.
Literaturempfehlung: Gerd Gigerenzer: Risikobewusst: Wie man gute Entscheidungen trifft (2014).
Welche PPV- und NPV-Werte erforderlich sind, um einen diagnostischen Test sinnvoll zu gestalten, hängt jedoch stark von der Anwendung ab.
Wie bereits erläutert, liegt der Schwerpunkt beim Screening auf der Früherkennung von Krebs in der Regel auf PPV, dh, Sie müssen sicherstellen, dass Sie nicht zu viel Schaden durch falsche Negative verursachen. Das Auffinden eines beträchtlichen Anteils (auch wenn nicht aller) der frühen Krebspatienten ist bereits eine Verbesserung gegenüber der Status quo ohne Screening.
Der OTOH- HIV-Test bei Blutspenden befasst sich zunächst mit dem NPV (dh der Sicherstellung, dass das Blut HIV-frei ist). In einem zweiten (und dritten) Schritt werden dann die falsch positiven Ergebnisse durch weitere Tests reduziert, bevor Menschen mit (falsch) positiven HIV-Testergebnissen beunruhigt werden.
Last but not least gibt es auch medizinische Testanwendungen, bei denen die Inzidenzen oder Prävalenzen nicht so extrem sind wie beim Screening von nicht besonders risikoreichen Populationen, z. B. bei einigen Differenzialdiagnosen.
quelle
Aus persönlicher Sicht hat ein falsches Positiv einen höheren Einfluss auf die Lebensqualität des Patienten als ein falsches Negativ (zumindest in den meisten Anwendungen der medizinischen Bildverarbeitung. Hier geht es nicht um Laborergebnisse). .
Schauen wir uns ein konkretes Beispiel an: das Tumor-Screening .
Ein falsches Negativ bedeutet, dass ein Tumor im Frühstadium mehr Zeit hat, zu wachsen und sich zu bösartigem Krebs zu entwickeln. Insgesamt dauert dieser Vorgang lange und jedes nachfolgende Screening hat eine höhere Wahrscheinlichkeit, ihn zu erkennen, aber realistisch gesehen leidet die Langzeitgesundheit eines Patienten.
Darüber hinaus ist immer ein Mensch an der Diagnose beteiligt. Die medizinische Bildverarbeitung in ihrer derzeitigen technologischen Phase soll dem medizinischen Personal helfen und nicht ersetzen . Es wird oft gemeint, um auf Läsionen oder Veränderungen im Gewebe hinzuweisen, die so subtil sind, dass ein Mensch sie übersehen könnte. Es gibt keine Chance, dass ein Arzt einen Tumor im fortgeschrittenen Stadium übersieht. Sie brauchen dafür keine Bildverarbeitung.
In Bezug auf medizinische Verfahren besteht kein großer Unterschied zwischen der Entfernung eines Tumors im Frühstadium und einem Tumor, der etwas mehr Zeit zum Wachsen hatte, wenn ein Tumor vor dem nächsten Screening nicht funktionsunfähig wird. Die Menge des entfernten Gewebes ist größer, aber die Art der Operation ist oft dieselbe. (Dies setzt voraus, dass der Patient regelmäßige Gesundheitsuntersuchungen durchführt.)
Ein falsches Positiv hat viele Implikationen, die nicht alle direkt mit einer Krankheit zusammenhängen:
Diese Risiko-Nutzen-Bewertung zeigt, dass ein falsches Negativ ein geringeres Risiko für einen Patienten beinhaltet als ein falsches Positiv. Daher ist die Priorität der Reduzierung von Fehlalarmen in der Regel höher.
quelle
Die Zeit des Klinikers ist kostbar
Aus dem Bereich der Medizin haben Kliniker häufig eine Vielzahl von Krankheiten zu entdecken und zu diagnostizieren, und dies ist ein zeitaufwendiger Prozess. Ein Tool, das ein falsches Positiv darstellt (auch wenn es nur eine geringe Rate aufweist), ist weniger nützlich, da es nicht möglich ist, dieser Diagnose zu vertrauen. Dies bedeutet, dass jedes Mal, wenn diese Diagnose erstellt wird, eine Überprüfung erforderlich ist. Stellen Sie es sich wie das WebMD von Software vor - alles ist ein Zeichen von Krebs!
Ein Tool, das falsche Negative darstellt, aber immer echte Positive darstellt, ist weitaus nützlicher, da ein Kliniker keine Zeit damit verschwenden muss, die Diagnose noch einmal zu überprüfen oder zu erraten. Wenn es jemanden mit einer bestimmten Diagnose als krank kennzeichnet, ist die Arbeit erledigt. Ist dies nicht der Fall, erhalten die Personen, die nicht als krank markiert sind, trotzdem zusätzliche Tests.
Es ist besser, ein Tool zu haben, das sogar ein einzelnes Merkmal einer Krankheit genau identifizieren kann, als ein Tool, das möglicherweise mehrere Merkmale verfälscht.
quelle
False Positive Rate (FPR), auch Falschalarmrate (FAR) genannt; Eine große False Positive Rate kann zu einer schlechten Leistung des medizinischen Bilderkennungssystems führen. Bei einem falsch positiven Ergebnis erhalten Sie ein positives Ergebnis für einen Test, wenn Sie ein negatives Ergebnis hätten erhalten sollen. Zum Beispiel ist ein Schwangerschaftstest positiv, wenn die Person tatsächlich nicht schwanger ist.
quelle
Aller Wahrscheinlichkeit nach weiß jeder in diesem Thread bereits, dass dies ein Problem im Kern der Bayes'schen Analyse ist. Ich hoffe, dass dieser Kommentar nur zum Wohle künftiger Pilger, die False Positives für ein rein radiologisches Problem halten, eine etwas allgemeinere Perspektive bietet.
quelle