Als «gradient-descent» getaggte Fragen

Gradient Descent ist ein Algorithmus zum Ermitteln des Minimums einer Funktion. Es berechnet iterativ partielle Ableitungen (Gradienten) der Funktion und steigt in Schritten ab, die proportional zu diesen partiellen Ableitungen sind. Eine Hauptanwendung von Gradient Descent ist das Anpassen eines parametrisierten Modells an einen Datensatz: Die zu minimierende Funktion ist eine Fehlerfunktion für das Modell.

12
Wie viele LSTM-Zellen soll ich verwenden?

Gibt es Faustregeln (oder tatsächliche Regeln) für die minimale, maximale und "angemessene" Anzahl von LSTM-Zellen, die ich verwenden sollte? Insbesondere beziehe ich mich auf BasicLSTMCell von TensorFlow und num_unitsEigenschaft. Bitte nehmen Sie an, dass ich ein Klassifizierungsproblem habe, das...