Betrachten Sie eine Eingangsmatrix und einen Binärausgang y .
Eine übliche Methode zur Messung der Leistung eines Klassifikators ist die Verwendung von ROC-Kurven.
In einem ROC-Diagramm ist die Diagonale das Ergebnis, das von einem zufälligen Klassifikator erhalten würde. Im Falle einer unsymmetrischen Ausgabe die Leistung eines Zufallsklassifizierers verbessert werden, indem 0 oder 1 mit unterschiedlichen Wahrscheinlichkeiten gewählt wird.
Wie kann die Leistung eines solchen Klassifikators in einem ROC-Kurvendiagramm dargestellt werden? Ich nehme an, es sollte eine gerade Linie mit einem anderen Winkel sein und nicht mehr die Diagonale?
Antworten:
ROC-Kurven sind unempfindlich gegenüber dem Klassengleichgewicht. Die gerade Linie, die Sie jetzt für einen zufälligen Klassifikator erhalten, ist bereits das Ergebnis der Verwendung unterschiedlicher Wahrscheinlichkeiten für eine positive Ausbeute (0 bringt Sie zu (0, 0) und 1 bringt Sie zu (1, 1) mit einem beliebigen Bereich dazwischen).
In einer unausgeglichenen Umgebung ändert sich nichts.
quelle