Ich benutze ein LSTM- und Feed-Forward-Netzwerk, um Text zu klassifizieren.
Ich konvertiere den Text in One-Hot-Vektoren und speise jeden in den lstm ein, damit ich ihn als eine einzige Darstellung zusammenfassen kann. Dann füttere ich es dem anderen Netzwerk.
Aber wie trainiere ich das lstm? Ich möchte den Text nur nacheinander klassifizieren - soll ich ihn ohne Training füttern? Ich möchte die Passage nur als einzelnes Element darstellen, das ich in die Eingabeebene des Klassifikators einspeisen kann.
Ich würde mich über einen Rat dazu sehr freuen!
Aktualisieren:
Ich habe also einen lstm und einen Klassifikator. Ich nehme alle Ausgaben des lstm und bündele sie, dann speise ich diesen Durchschnitt in den Klassifikator ein.
Mein Problem ist, dass ich nicht weiß, wie ich den lstm oder den Klassifikator trainieren soll. Ich weiß, was die Eingabe für das lstm sein sollte und was die Ausgabe des Klassifikators für diese Eingabe sein sollte. Da es sich um zwei separate Netzwerke handelt, die nur nacheinander aktiviert werden, muss ich wissen und weiß nicht, wie die ideale Ausgabe für den lstm aussehen soll, die auch die Eingabe für den Klassifizierer sein würde. Gibt es eine Möglichkeit, dies zu tun?
quelle