Ausgewogene Genauigkeit im Vergleich zum F-1-Score

14

Ich habe mich gefragt, ob irgendjemand den Unterschied zwischen ausgewogener Genauigkeit erklären kann

b_acc = (sensitivity + specificity)/2

und f1 Punktzahl, die ist:

f1 = 2*precision*recall/(precision + recall) 
dvreed77
quelle

Antworten:

18

Mathematisch ist b_acc das arithmetische Mittel von Recall_P und Recall_N und f1 ist das harmonische Mittel von Recall_P und Präzision_P.

Sowohl F1 als auch b_acc sind Metriken für die Klassifikatorbewertung, die (in gewissem Maße) das Klassenungleichgewicht handhaben. Je nachdem, welche der beiden Klassen (N oder P) die andere übertrifft, übertrifft jede Metrik die andere.

1) Wenn N >> P, ist f1 besser.

2) Wenn P >> N, ist b_acc besser.

Wenn Sie die Beschriftung wechseln können, können beide Metriken in jedem der beiden oben genannten Ungleichgewichtsfälle verwendet werden. Wenn nicht, können Sie je nach Ungleichgewicht in den Trainingsdaten die entsprechende Metrik auswählen.

Shashwat
quelle
1
Vielen Dank, Sir. Haben Sie eine Referenz für die Informationen zur Auswahl von Fscore vs. ausgewogener Genauigkeit in Bezug auf die Anzahl der positiven / negativen Klassen?
Gin
Ich möchte die Anfrage von @ gin nach weiteren Informationen zur Auswahl zwischen den beiden unterstützen. Ich habe einige Daten, bei denen der N etwa 8% beträgt. Nach der obigen Antwort sollte ich anscheinend Balanced Accuracy verwenden. Ich habe nach anderen Referenzen für diese Wahl gesucht (P> N -> b_acc), aber nichts gesehen.
Anguyen1210
Das ergibt für mich keinen Sinn. Die ausgeglichene Genauigkeit ist bei der Etikettenumschaltung gleichbleibend. Wie können Sie es durch Labelwechsel "verbessern", wenn es unverändert bleibt?
TC Proctor