Ich versuche zu verstehen, was der Zweck der Verlustfunktion ist, und ich kann es nicht ganz verstehen.
Nach meinem Verständnis dient die Verlustfunktion zur Einführung einer Art Metrik, mit der wir die "Kosten" einer falschen Entscheidung messen können.
Nehmen wir an, ich habe einen Datensatz von 30 Objekten. Ich habe sie in Trainings- / Testsätze wie 20/10 unterteilt. Ich verwende die 0-1-Verlustfunktion. Nehmen wir also an, mein Satz von Klassenbezeichnungen ist M und die Funktion sieht so aus :
Also baute ich ein Modell auf meinen Trainingsdaten auf, sagen wir, ich verwende den Naive Bayes-Klassifikator, und dieses Modell klassifizierte 7 Objekte richtig (wies ihnen die richtigen Klassenbeschriftungen zu) und 3 Objekte wurden falsch klassifiziert.
Meine Verlustfunktion würde also 7-mal "0" und 3-mal "1" zurückgeben - welche Art von Informationen kann ich daraus erhalten? Dass mein Model 30% der Objekte falsch klassifiziert hat? Oder steckt noch mehr dahinter?
Wenn es Fehler in meiner Denkweise gibt, tut es mir sehr leid, ich versuche nur zu lernen. Wenn das von mir angegebene Beispiel "zu abstrakt" ist, lassen Sie es mich wissen, ich werde versuchen, genauer zu sein. Wenn Sie versuchen, das Konzept anhand eines anderen Beispiels zu erläutern, verwenden Sie bitte die 0-1-Verlustfunktion.
quelle
quelle
Ich denke, Ihre Verwirrung unterscheidet nicht den Verlust für einen Datenpunkt gegenüber dem Verlust für den gesamten Datensatz.
quelle