Ist es bei Verwendung einer Mehrschicht LSTM
mit Dropout ratsam, Dropout auf alle ausgeblendeten Ebenen sowie auf die Ausgabeebenen für dichte Ebenen zu setzen? In Hintons Artikel (der Dropout vorschlug) legte er Dropout nur auf die dichten Schichten, aber das lag daran, dass die verborgenen inneren Schichten faltungsmäßig waren.
Natürlich kann ich mein spezifisches Modell testen, aber ich habe mich gefragt, ob diesbezüglich ein Konsens besteht.
neural-network
lstm
rnn
dropout
stacked-lstm
BigBadMe
quelle
quelle
Antworten:
Ich bevorzuge es, aus
LSTM
einem bestimmten und klaren Grund keinen Ausfall in Zellen hinzuzufügen .LSTMs
sind auf lange Sicht gut, aber eine wichtige Sache an ihnen ist, dass sie nicht sehr gut darin sind, mehrere Dinge gleichzeitig auswendig zu lernen. Die Logik des Ausfalls besteht darin, den Neuronen Rauschen hinzuzufügen, um nicht von einem bestimmten Neuron abhängig zu sein. Durch Hinzufügen von Drop-Out fürLSTM
Zellen besteht die Möglichkeit, etwas zu vergessen, das nicht vergessen werden sollte. FolglichCNNs
bevorzuge ich es immer, Drop-Out in dichten Schichten nach denLSTM
Schichten zu verwenden.quelle
CNNs
es völlig akzeptabel nicht zu verwenden , um sie in conv Schichten aufgrund der geringen Anzahl von Gewichten in Faltungsschichten ist. InLSTMs
auf der anderen Seite, ist die Anzahl der Gewichte nicht klein. Wie ich in Aufgaben erwähnt habe, dass es zahlreiche Dinge gibt, die auswendig gelernt werden müssen, versuche ich, keine Aussetzer zu verwenden, aber es Fälle wie die Zeitform der Verben, dass Sie nicht viele Abhängigkeiten haben, ich denke, es ist nicht sehr schlecht. Übrigens war es meine Erfahrung. Möglicherweise gibt es andere Antworten für verschiedene Anwendungsdomänen.Es gibt keinen Konsens, der für alle Modelltypen bewiesen werden kann.
Wenn Sie sich Dropout als eine Form der Regularisierung vorstellen, wie viel (und wo) angewendet werden soll, hängt dies inhärent von der Art und Größe des Datasets sowie von der Komplexität Ihres erstellten Modells (wie groß es ist) ab.
quelle