Zielfunktion für die Klassifizierung mehrerer Etiketten

7

Die übliche Zielfunktion für die Klassifizierung mehrerer Etiketten (z. B. M-Etiketten) ist die binäre Kreuzentropie. Das Problem ist, wenn wir binäre Kreuzentropie verwenden, nehmen wir an, dass die Ausgabebezeichnungen unabhängig voneinander sind, was das Problem zu M unabhängigen binären Klassifizierungsproblemen macht. Gibt es eine geeignete Zielfunktion, die die Ausgabeetiketten voneinander abhängig macht?

Pythoninker
quelle
Ich denke, die Hauptidee des gesamten Konzepts ist, dass es sich um zufällige Prozesse handelt i.i.d.
Medien
1
Dieses Ziel wäre ein interessantes Ziel, das mir nicht bekannt ist! Wie könnte man gleichzeitig davon profitieren? Was ist Ihre Domain (Ziel), von der Sie sicher sind, dass diese Labels abhängig sind? Nehmen Sie den CelebA-Multilabel-Datensatz ( mmlab.ie.cuhk.edu.hk/projects/CelebA.html ), einige Labels könnten als abhängige Frauen / Lippenstifte / etc. Betrachtet werden, andere jedoch nicht, bei denen man davon profitieren könnte unabhängig sein.
TwinPenguins
1
@MajidMortazavi Vielen Dank für Zeit und Rücksichtnahme. Die Anwendung ist medizinische Kodierung. Der Vorteil ist, dass verschiedene Krankheiten etwas gemeinsam haben. Vielen Dank, dass Sie mir einen neuen Datensatz vorgestellt haben.
Pythoninker
1
Wenn es sich um ein neuronales Netzwerk handelt, erfolgt die gesamte Klassifizierung zusammen bis zur letzten Schicht, in der sie durch binäre Kreuzentropie getrennt werden. Mein Verständnis ist, dass in neuronalen Netzen wie bei der Bilderkennung die Erkennung auf allen vorherigen Schichten außer der letzten verbunden ist. Für neuronale Netze ist es also keine große Sache, dass die letzte Schicht jede Kategorie separat vorhersagt.
keiv.fly

Antworten:

1

Was Sie suchen, heißt "kostensensitive Klassifizierung". Die meisten Methoden funktionieren jedoch nicht mit Etikettenähnlichkeiten, sondern mit relativen Strafen für verschiedene Arten von Fehlklassifizierungen.

anymous.asker
quelle