Kann mir jemand erklären, wie man Daten wie MNIST mit MLBP-Neural Network klassifiziert, wenn ich mehr als eine Ausgabe mache (zB 8)? Ich meine, wenn ich nur eine Ausgabe verwende, kann ich die Daten leicht klassifizieren, aber wenn ich mehr als verwende eine, welche Ausgabe soll ich wählen?
neural-network
Aldy Syahdeini
quelle
quelle
Antworten:
Angenommen, Sie müssen etwas in K-Klassen klassifizieren, wobei K> 2. In diesem Fall ist das am häufigsten verwendete Setup eine Hot-Codierung. Sie haben K Ausgabespalten, und im Trainingssatz setzen Sie alle Werte auf 0, mit Ausnahme desjenigen mit dem Kategorieindex, der den Wert 1 haben könnte. Somit haben Sie für jede Trainingsdatensatzinstanz alle Ausgaben mit Werten 0 oder 1 summieren sich alle Ausgänge für jede Instanz zu 1.
Dies sieht aus wie eine Wahrscheinlichkeit, die mich an eine Technik erinnert, die häufig verwendet wird, um einige Ausgaben zu verbinden, die als Wahrscheinlichkeit modelliert sind. Dies nennt man Softmax-Funktion, weitere Details auf Wikipedia . Auf diese Weise können Sie die Ausgabewerte einschränken (dies ist im Grunde eine Verallgemeinerung der logistischen Funktion), sodass die Ausgabewerte als Wahrscheinlichkeiten modelliert werden.
Schließlich können Sie mit oder ohne Softmax die Ausgabe als Diskriminanzfunktion verwenden, um die richtige Kategorie auszuwählen.
Ein weiterer letzter Gedanke wäre, zu vermeiden, dass Sie Variablen auf verbundene Weise codieren. Beispielsweise können Sie die binäre Darstellung des Kategorieindex haben. Dies würde dem Lernenden eine künstliche Verbindung zwischen einigen willkürlichen Ausgaben induzieren. Die eine Hot-Codierung hat den Vorteil, dass sie neutral ist, wie Etiketten indiziert werden.
quelle
Der in diesem Fall verwendete Algorithmus wird als Ein-gegen-Alle-Klassifizierer oder Mehrklassenklassifizierer bezeichnet.
In Ihrem Fall müssen Sie eine Klasse, z. B. Nummer 1, als positiv markieren und die restlichen sieben Klassen in einer negativen Klasse kombinieren. Das neuronale Netzwerk gibt die Wahrscheinlichkeit aus, dass dieser Fall die Klasse Nummer 1 im Vergleich zu den übrigen Klassen ist.
Nach Worten müssen Sie eine andere Klasse als positiv zuweisen, z. B. Nummer 2, alle anderen Klassen als eine große negative Klasse zuweisen und die vorhergesagte Wahrscheinlichkeit erneut vom Netzwerk erhalten.
Nachdem Sie diesen Vorgang für alle acht Klassen wiederholt haben, ordnen Sie jeden Fall der Klasse zu, die die maximale Wahrscheinlichkeit aus allen vom neuronalen Netzwerk ausgegebenen Klassen hatte.
quelle