Wie viele Parameter befinden sich in einer RNN-Schicht (Gated Recurrent Unit)?

Der Titel sagt schon alles - wie viele trainierbare Parameter gibt es in einer GRU-Schicht? Diese Art von Frage taucht häufig auf, wenn versucht wird, Modelle verschiedener RNN-Schichttypen, wie z. B. LSTM-Einheiten (Long Short Term Memory), mit GRU hinsichtlich der Leistung pro Parameter zu vergleichen. Da eine größere Anzahl trainierbarer Parameter im Allgemeinen die Lernfähigkeit des Netzwerks erhöht, ist der Vergleich alternativer Modelle auf Parameterbasis ein Vergleich der relativen Wirksamkeit von GRUs und LSTMs von Apfel zu Apfel.

neural-networks rnn gru Sycorax sagt Reinstate Monica
quelle

Antworten:

Laut Rahul Dey und Fathi M. Salem, " Gate-Varianten von neuronalen Netzen mit Gated Recurrent Unit (GRU) ":

... die Gesamtzahl der Parameter in der GRU RNN beträgt . $3 \times (n^2 + nm + n)$

Dabei ist die Eingabedimension und die Ausgabedimension. Dies liegt an der Tatsache, dass es drei Sätze von Operationen gibt, die Gewichtsmatrizen dieser Größen erfordern. $m$ $n$

Sycorax sagt Reinstate Monica
quelle