Ich verstehe, dass das f-Maß (basierend auf Präzision und Rückruf) eine Schätzung der Genauigkeit eines Klassifikators ist. Außerdem wird f-Measure gegenüber Genauigkeit bevorzugt, wenn wir einen unausgeglichenen Datensatz haben. Ich habe eine einfache Frage (bei der es mehr um die Verwendung der richtigen Terminologie als um die Technologie geht). Ich habe einen unausgeglichenen Datensatz und verwende in meinen Experimenten f-Measure. Ich bin dabei, eine Arbeit zu schreiben, die NICHT für eine Konferenz über maschinelles Lernen / Data Mining bestimmt ist. Daher kann ich in diesem Zusammenhang synonym mit Genauigkeit auf f-Measure verweisen. Zum Beispiel habe ich ein f-Maß von 0,82. Kann ich dann sagen, dass mein Klassifikator 82% genaue Vorhersagen erzielt?
10
Antworten:
Erstens finde ich "Genauigkeit" manchmal etwas irreführend, da sie sich auf bestimmte Dinge bezieht:
Der Begriff Genauigkeit im Geneal für die Bewertung von Systemen oder Methoden (ich bin analytischer Chemiker) bezieht sich auf die Verzerrung von Vorhersagen, dh er beantwortet die Frage, wie gut Vorhersagen im Durchschnitt sind.
Wie Sie wissen, gibt es viele verschiedene Leistungsmaßstäbe, die unterschiedliche Leistungsaspekte für Klassifizierer beantworten. Eine davon nennt man auch Genauigkeit. Wenn Ihre Arbeit nicht für ein Publikum mit maschinellem Lernen / Klassifizierung gedacht ist, empfehle ich, diese Unterscheidung sehr deutlich zu machen. Selbst für diese spezifischere Bedeutung von Genauigkeit würde ich sehr genau sagen, was ich Genauigkeit nenne, da wiederum verschiedene Arten des Umgangs mit Klassenungleichgewichten auftreten können. Typischerweise wird das Klassenungleichgewicht ignoriert, was zu dem bekannten Berechnung. Sie können jedoch auch den Durchschnitt der Sensitivität und Spezifität verwenden, der der Kontrolle des Klassenungleichgewichts durch Gewichtung Ihres Durchschnitts gleichkommt.T.P.+ T.N.a l l c a s e s
Der F-Score wird häufig als harmonisches Mittel für Präzision und Erinnerung (oder als positiver Vorhersagewert und Empfindlichkeit) eingeführt. Für Ihre Frage halte ich es für hilfreich, dies etwas näher zu formulieren und zu vereinfachen:
Der letzte Ausdruck ist kein Bruchteil von allem, was ich mir als eine bestimmte Gruppe von Testfällen vorstellen kann. Insbesondere wird eine (starke) Überlappung zwischen den Fällen TRUE und POSITIVE erwartet. Dies würde mich davon abhalten, einen F-Score als Prozentsatz auszudrücken, da dies einen Teil der Fälle impliziert. Eigentlich denke ich, ich würde den Leser warnen, dass der F-Score keine solche Interpretation hat.
quelle
Schnelle Antwort:
Nein, die
F-measure
Formel besteht nicht aus einemTN
Faktor und ist nützlich, um Probleme abzurufen (doc) .Daher ist es (
F-measure
) der richtige Ansatz, die unausgeglichenen Datensätze oder bei Abrufproblemen anstelle vonaccuracy
und auszuwertenROC
.[ HINWEIS ]:
quelle