Eine korrekte Bewertungsregel ist eine Regel, die durch ein "echtes" Modell maximiert wird und kein "Absichern" oder Spielen des Systems erlaubt (absichtlich unterschiedliche Ergebnisse zu melden, wie es der wahre Glaube des Modells ist, um die Bewertung zu verbessern). Der Brier-Score ist korrekt, die Genauigkeit (Anteil richtig klassifiziert) ist nicht korrekt und wird oft entmutigt. Manchmal stelle ich fest, dass AUC als eine semi-korrekte Bewertungsregel bezeichnet wird, die es nicht als völlig falsch ansieht, sondern weniger empfindlich als richtige Regeln ist (zum Beispiel hier /stats//a/90705/53084 ).
Was bedeutet die Regel der halb ordnungsgemäßen Wertung? Ist es irgendwo definiert?
Antworten:
Beginnen wir mit einem Beispiel. Angenommen, Alice ist ein Streckentrainer und möchte einen Athleten auswählen, der das Team bei einem bevorstehenden Sportereignis, einem 200-Meter-Sprint, repräsentiert. Natürlich will sie den schnellsten Läufer auswählen.
Das obige Beispiel zeigt, wenn auch etwas trivialisiert, was mit der Verwendung von Bewertungsregeln geschieht. Alice prognostizierte die erwartete Sprintzeit. Im Rahmen der Klassifikation prognostizieren wir Wahrscheinlichkeiten, die den Fehler eines probabilistischen Klassifikators minimieren.
Wie wir sehen, ist die Regel der semi-korrekten Wertung nicht perfekt, aber auch nicht geradezu katastrophal. Dies kann während der Vorhersage sehr nützlich sein! Cagdas Ozgenc hat hier ein großartiges Beispiel , bei dem die Arbeit mit einer unzulässigen / halb ordnungsgemäßen Regel einer streng ordnungsgemäßen Regel vorzuziehen ist. Im Allgemeinen ist der Begriff der semi-korrekten Bewertungsregel nicht sehr verbreitet. Es ist mit falschen Regeln verbunden , die dennoch hilfreich sein können (zB AUC-ROC oder MAE bei der probabilistischen Klassifizierung).
Beachten Sie zum Schluss etwas Wichtiges. Wie Sprinten mit starken Beinen verbunden ist, ist auch die korrekte Wahrscheinlichkeitsklassifizierung mit Genauigkeit verbunden. Es ist unwahrscheinlich, dass ein guter Sprinter schwache Beine hat, und ebenso ist es unwahrscheinlich, dass ein guter Klassifikator eine schlechte Genauigkeit hat. Gleichwohl ist das Gleichsetzen der Genauigkeit mit einer guten Klassifikatorleistung das Gleichsetzen der Beinstärke mit einer guten Sprintleistung. Nicht völlig unbegründet, aber sehr plausibel, um zu unsinnigen Ergebnissen zu führen.
quelle