Intuitive Erklärung von Logloss

In mehreren Kaggle-Wettbewerben basierte die Wertung auf "logloss". Dies bezieht sich auf einen Klassifizierungsfehler.

Hier ist eine technische Antwort, aber ich suche nach einer intuitiven Antwort. Die Antworten auf diese Frage zur Mahalanobis-Entfernung haben mir sehr gut gefallen , aber PCA ist kein logarithmischer Verlust.

Ich kann den Wert verwenden, den meine Klassifizierungssoftware ausgibt, aber ich verstehe ihn nicht wirklich. Warum verwenden wir es anstelle von wahren / falschen positiven / negativen Raten? Können Sie mir helfen, damit ich dies meiner Großmutter oder einem Neuling auf dem Gebiet erklären kann?

Ich mag auch und stimme dem Zitat zu:

Sie verstehen etwas nicht wirklich, es sei denn, Sie können es Ihrer Großmutter
- Albert Einstein - erklären

Ich habe versucht, dies selbst zu beantworten, bevor ich hier gepostet habe.

Zu den Links, die ich nicht intuitiv oder wirklich hilfreich fand, gehören:

Diese sind informativ und genau. Sie sind für ein technisches Publikum gedacht. Sie zeichnen kein einfaches Bild oder geben einfache und leicht zugängliche Beispiele. Sie sind nicht für meine Großmutter geschrieben.

interpretation intuition loss-functions EngrStudent
quelle

Sie haben keinen Link zu Ihrer technischen Antwort angegeben

Bdeonovic

quora.com/…

Ehsan M. Kermani

@ EhsanM.Kermani - Ich fand diese intuitiven wie die für Mahalanobis, auf die ich verwies, nicht.

EngrStudent

Der Eintrag auf der Kaggle-Website gibt eine ziemlich präzise Erklärung von Logloss

Bdeonovic

Diesen Link gefunden: exegetic.biz/blog/2015/12/making-sense-logarithmic-loss . Könnte helfen.

Deolu A

Antworten:

Logloss ist der Logarithmus des Produkts aller Wahrscheinlichkeiten. Angenommen, Alice hat vorausgesagt:

mit einer Wahrscheinlichkeit von 0,2 wird John Jack töten
Mit einer Wahrscheinlichkeit von 0,001 wird Mary John heiraten
Mit einer Wahrscheinlichkeit von 0,01 ist Bill ein Mörder.

Es stellte sich heraus, dass Mary John nicht heiratete, Bill ist kein Mörder, aber John hat Jack getötet. Das Produkt der Wahrscheinlichkeiten beträgt laut Alice 0,2 * 0,999 * 0,99 = 0,197802

Bob sagte voraus:

Mit einer Wahrscheinlichkeit von 0,5 wird John Jack töten
Mit einer Wahrscheinlichkeit von 0,5 wird Mary John heiraten
Mit einer Wahrscheinlichkeit von 0,5 ist Bill ein Mörder.

Das Produkt ist 0,5 · 0,5 · 0,5 = 0,125.

Alice ist ein besserer Prädiktor als Bob.

user31264
quelle

Warum funktioniert "Produkt aller Wahrscheinlichkeiten"? Dies klingt wie ein Verwandter der Erwartungsmaximierung.

EngrStudent

Benötigen Sie einen formellen Nachweis? Es ist in der "technischen Antwort", die vom Themenstarter erwähnt wird. Benötigen Sie einen informellen "Großmutter" Grund warum? Sie sagen: Angenommen, dieser Kerl hat korrekte Vorhersagen gemacht. Wie groß ist die Wahrscheinlichkeit, dass alles so passiert, wie es wirklich passiert ist? Dies ist das Produkt von Wahrscheinlichkeiten.

user31264

"Produkt der Wahrscheinlichkeiten" ist nicht "Oma". log of product of probabilities ist die Summe der log-Wahrscheinlichkeiten, die sie zur Erwartungsmaximierung verwenden und "Erwartung" nennen. Ich denke, es ist auch in KL-Divergenz codiert. ... Ich denke, im Oma-Gespräch könnte man sagen "" am wahrscheinlichsten "= höchste Gesamtwahrscheinlichkeit mehrerer Ereignisse. Es gibt zwei, die" am höchsten "sind: 1) Maximieren Sie die kombinierte Wahrscheinlichkeit oder 2) Minimieren Sie die negative kombinierte Wahrscheinlichkeit. Die meisten Maschinen Lernen mag "Gradientenabstieg" oder Minimieren von Schlechtigkeit. Log-Verlust ist die negative Wahrscheinlichkeit, die durch die Stichprobengröße skaliert wird, und sie wird minimiert.

EngrStudent

Hier Link sagen sie "exp (-loss) ist die durchschnittliche Wahrscheinlichkeit einer korrekten Vorhersage."

EngrStudent

Ich mochte den Bischofsreferenten hier . Es ist Gleichung 4.108 und ist die Kreuzentropiefehlerfunktion.

EngrStudent