In mehreren Kaggle-Wettbewerben basierte die Wertung auf "logloss". Dies bezieht sich auf einen Klassifizierungsfehler.
Hier ist eine technische Antwort, aber ich suche nach einer intuitiven Antwort. Die Antworten auf diese Frage zur Mahalanobis-Entfernung haben mir sehr gut gefallen , aber PCA ist kein logarithmischer Verlust.
Ich kann den Wert verwenden, den meine Klassifizierungssoftware ausgibt, aber ich verstehe ihn nicht wirklich. Warum verwenden wir es anstelle von wahren / falschen positiven / negativen Raten? Können Sie mir helfen, damit ich dies meiner Großmutter oder einem Neuling auf dem Gebiet erklären kann?
Ich mag auch und stimme dem Zitat zu:
Sie verstehen etwas nicht wirklich, es sei denn, Sie können es Ihrer Großmutter
- Albert Einstein - erklären
Ich habe versucht, dies selbst zu beantworten, bevor ich hier gepostet habe.
Zu den Links, die ich nicht intuitiv oder wirklich hilfreich fand, gehören:
- http://www.r-bloggers.com/making-sense-of-logarithmic-loss/
- https://www.quora.com/Was- ist- eine- intuitive Erklärung für die Log-Verlust-Funktion
- https://lingpipe-blog.com/2010/11/02/evaluating-with-probabilistic-truth-log-loss-vs-0-1-loss/
- https://www.kaggle.com/wiki/LogarithmicLoss
Diese sind informativ und genau. Sie sind für ein technisches Publikum gedacht. Sie zeichnen kein einfaches Bild oder geben einfache und leicht zugängliche Beispiele. Sie sind nicht für meine Großmutter geschrieben.
quelle
Antworten:
Logloss ist der Logarithmus des Produkts aller Wahrscheinlichkeiten. Angenommen, Alice hat vorausgesagt:
Es stellte sich heraus, dass Mary John nicht heiratete, Bill ist kein Mörder, aber John hat Jack getötet. Das Produkt der Wahrscheinlichkeiten beträgt laut Alice 0,2 * 0,999 * 0,99 = 0,197802
Bob sagte voraus:
Das Produkt ist 0,5 · 0,5 · 0,5 = 0,125.
Alice ist ein besserer Prädiktor als Bob.
quelle