Können Sie unter der Annahme von richtig positiven, falsch negativen Raten falsch positive, richtig negative berechnen?

24

Ich habe Werte für True Positive (TP)und False Negative (FN)wie folgt:

TP = 0.25
FN = 0.75

Können wir aus diesen Werten berechnen False Positive (FP)und True Negative (TN)?

Einfachheit
quelle

Antworten:

53

In diesem Bereich gibt es einiges an terminologischer Verwirrung. Persönlich finde ich es immer nützlich, zu einer Verwirrungsmatrix zurückzukehren, um darüber nachzudenken. In einem Klassifizierungs- / Screening-Test können Sie vier verschiedene Situationen haben:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

In dieser Tabelle sind "richtig positiv", "falsch negativ", "falsch positiv" und "richtig negativ" Ereignisse (oder deren Wahrscheinlichkeit). Was Sie haben, ist daher wahrscheinlich eine echte positive Rate und eine falsche negative Rate . Die Unterscheidung ist wichtig, da betont wird, dass beide Zahlen einen Zähler und einen Nenner haben.

Etwas verwirrend ist, dass Sie mehrere Definitionen für „falsch positive Rate“ und „falsch negative Rate“ mit unterschiedlichen Nennern finden.

Zum Beispiel bietet Wikipedia die folgenden Definitionen (sie scheinen ziemlich Standard zu sein):

  • TPR=TP/(TP+FN)
  • Falsch positive Rate:FPR=FP/(FP+TN)
  • Echte negative Rate (oder Spezifität):TNR=TN/(FP+TN)

In allen Fällen ist der Nenner die Spaltensumme . Dies gibt auch einen Hinweis auf ihre Interpretation: Die wahre positive Rate ist die Wahrscheinlichkeit, dass der Test „A“ sagt, wenn der reale Wert tatsächlich A ist (dh es ist eine bedingte Wahrscheinlichkeit, die davon abhängig ist, dass A wahr ist). Dies sagt Ihnen nicht , wie wahrscheinlich es ist, dass Sie beim Aufrufen von „A“ richtig liegen (dh die Wahrscheinlichkeit eines echten Positivs, abhängig davon, dass das Testergebnis „A“ ist).

Unter der Annahme, dass die falsch negative Rate auf die gleiche Weise definiert ist, haben wir dann (beachten Sie, dass Ihre Zahlen damit übereinstimmen). Wir können die falsch-positive Rate jedoch nicht direkt aus der wahr-positiven oder der falsch-negativen Rate ableiten, da sie keine Informationen über die Spezifität liefern, dh wie sich der Test verhält, wenn "nicht A" die richtige Antwort ist. Die Antwort auf Ihre Frage wäre daher "Nein, es ist nicht möglich", da Sie keine Informationen in der rechten Spalte der Verwirrungsmatrix haben.FNR=1-TPR

Es gibt jedoch andere Definitionen in der Literatur. Beispielsweise bietet Fleiss ( Statistische Methoden für Kurse und Anteile ) Folgendes:

  • "[…] Die falsch-positive Rate […] ist der Anteil der Menschen unter den positiv reagierenden Personen, die tatsächlich frei von der Krankheit sind."
  • "Die Falsch-Negativ-Rate […] ist der Anteil der Personen, die auf den Test negativ reagieren und trotzdem an der Krankheit leiden."

(Er erkennt auch die vorherigen Definitionen an, betrachtet sie jedoch als „Verschwendung wertvoller Terminologie“, gerade weil sie in einem direkten Verhältnis zu Sensibilität und Spezifität stehen.)

Unter Bezugnahme auf die Konfusionsmatrix, bedeutet dies , dass und , so dass die Nenner sind die Zeilensummen. Wichtig ist, dass unter diesen Definitionen die falsch positiven und falsch negativen Raten nicht direkt aus der Sensitivität und Spezifität des Tests abgeleitet werden können. Sie müssen auch die Prävalenz kennen (dh wie häufig A in der Population von Interesse ist).FPR=FP/(TP+FP)FNR=FN/(TN+FN)

Fleiss verwendet oder definiert die Ausdrücke „wahre negative Rate“ oder „wahre positive Rate“ nicht. Wenn wir jedoch annehmen, dass dies bei einem bestimmten Testergebnis / einer bestimmten Einstufung auch bedingte Wahrscheinlichkeiten sind, ist die Antwort von @ guill11aume die richtige.

In jedem Fall müssen Sie mit den Definitionen vorsichtig sein, da Ihre Frage unbestreitbar nicht beantwortet wird.

Gala
quelle
4
Sehr gut (+1). Ich bin sofort auf eine Interpretation gesprungen, aber Sie haben absolut Recht, dass die alternative Definition Standard ist.
gui11aume
1
@ gui11aume. Vielen Dank! Es war mein Gefühl, aber wenn ich darüber nachdenke, bin ich mir nicht mehr so ​​sicher. Wenn man sich die Referenzen ansieht, kann dies vom Fachgebiet abhängen (maschinelles Lernen vs. medizinisches Testen).
Gala
Nach meiner Erfahrung ist die letztere Definition, TPR = TP / (TP + FP), FPR = FP / (TP + FP), mehr Standard.
travellingbones
1
Hier ist eine Veröffentlichung zu den Unterschieden: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Beachten Sie die neue Terminologie "Test FPR" vs. "Predictive FPR"
travellingbones
8

EDIT: siehe die Antwort von Gaël Laurans, die genauer ist.

Wenn Ihre wahre positive Rate 0,25 beträgt, bedeutet dies, dass Sie jedes Mal, wenn Sie ein Positiv anrufen, mit einer Wahrscheinlichkeit von 0,75 falsch liegen. Dies ist Ihre falsch positive Rate. In ähnlicher Weise haben Sie jedes Mal, wenn Sie ein Negativ nennen, eine Wahrscheinlichkeit von 0,25, richtig zu liegen, was Ihre wahre negative Rate ist.

gui11aume
quelle
Kommt darauf an, was man zu charakterisieren versucht: den Test in der Umgebung, um die Wahrheit vorher zu kennen, oder den Versuch, über die Wahrscheinlichkeit nach dem Test zu entscheiden, wenn man die Ergebnisse in der Hand hat.
kd4ttc
3

Keine, wenn dies irgendeinen Sinn ergibt, wenn "positiv" und "negativ" für das vorliegende Problem keinen Sinn ergeben. Ich sehe viele Probleme, bei denen "positiv" und "negativ" willkürliche erzwungene Entscheidungen für eine ordinale oder stetige Variable sind. FP, TP, sens, spec sind nur für Alles-oder-Nichts-Phänomene nützlich.

Frank Harrell
quelle