Ich habe eine ROC-Kurve für ein Diagnosesystem erstellt. Die Fläche unter der Kurve wurde dann nicht parametrisch auf AUC = 0,89 geschätzt. Als ich versuchte, die Genauigkeit bei der optimalen Schwellenwerteinstellung (dem Punkt, der dem Punkt (0, 1) am nächsten liegt) zu berechnen, erhielt ich eine Genauigkeit des Diagnosesystems von 0,8, was weniger als die AUC ist! Als ich die Genauigkeit bei einer anderen Schwellenwerteinstellung überprüfte, die weit vom optimalen Schwellenwert entfernt ist, erhielt ich eine Genauigkeit von 0,92. Ist es möglich, die Genauigkeit eines Diagnosesystems bei der besten Schwellenwerteinstellung niedriger als die Genauigkeit bei einem anderen Schwellenwert und auch niedriger als der Bereich unter der Kurve zu erhalten? Siehe bitte das beigefügte Bild.
quelle
Antworten:
Um es anders auszudrücken: Wenn der Klassifikator die ganze Zeit 0 vorhersagt, hat er immer noch eine hohe Genauigkeit mit FPR und TPR nahe 0, da Sie viel mehr negative Samples haben.
Was Sie als optimale Schwellenwerteinstellung bezeichnen (der Punkt, der dem Punkt (0, 1) am nächsten liegt), ist nur eine von vielen Definitionen für einen optimalen Schwellenwert: Er optimiert nicht unbedingt die Genauigkeit.
quelle
In diesem Beispiel sind die Negative größer als die Positiven 1000: 1.
Sehen Sie, wenn
fpr
0acc
maximal ist.Und hier ist der ROC mit der angegebenen Genauigkeit.
Die Quintessenz ist, dass Sie die Genauigkeit so optimieren können, dass ein falsches Modell entsteht (
tpr
= 0 in meinem Beispiel). Dies liegt daran, dass Genauigkeit keine gute Messgröße ist. Die Zweiteilung des Ergebnisses sollte dem Entscheidungsträger überlassen werden.Bei unausgeglichenen Klassen kann die Optimierung der Genauigkeit trivial sein (z. B. voraussagen, dass jeder die Mehrheit der Klassen darstellt).
Fläche unter der Kurve des ROC im Verhältnis zur Gesamtgenauigkeit
Genauigkeit und Fläche unter der ROC-Kurve (AUC)
Und das Wichtigste von allem: Warum ist die AUC bei einem Klassifikator, der weniger genau ist, höher als bei einem, der genauer ist?
quelle