Wie viele Parameter hat ein einzelner gestapelter LSTM? Die Anzahl der Parameter legt eine Untergrenze für die Anzahl der erforderlichen Trainingsbeispiele fest und beeinflusst auch die Trainingszeit. Daher ist es für Trainingsmodelle mit LSTMs hilfreich, die Anzahl der Parameter zu kennen.
deep-learning
rnn
Wabbit
quelle
quelle
Folgende früheren Antworten, die Anzahl der Parameter von LSTM, Eingangsvektoren der Größe unter und geben Ausgangsvektoren der Größe ist:m n
Falls Ihr LSTM jedoch Bias-Vektoren enthält ( dies ist beispielsweise die Standardeinstellung in Keras ), lautet die Zahl:
quelle
Nach dieser :
LSTM-Zellstruktur
LSTM-Gleichungen
Ingoring Nichtlinearitäten
Wenn der Eingang X_t die Größe n x 1, und es gibt d Speicherzellen, dann ist die Größe jeden W * und U * ist , d × n und d × d resp. Die Größe von W wird dann 4d x (n + d) . Es ist zu beachten, dass jede der dd-Speicherzellen ihre eigenen Gewichte W ∗ und U ∗ hat und dass der einzige Zeitpunkt, zu dem Speicherzellenwerte mit anderen LSTM-Einheiten geteilt werden, während des Produkts mit U ∗ ist .
Vielen Dank an Arun Mallya für die großartige Präsentation.
quelle