Gibt es eine Faustregel zwischen der Tiefe eines neuronalen Netzwerks und der Lernrate? Mir ist aufgefallen, dass die Lernrate umso niedriger sein muss, je tiefer das Netzwerk ist.
Wenn das richtig ist, warum ist das so?
neural-networks
deep-learning
hyperparameter
rule-of-thumb
user_1177868
quelle
quelle
Antworten:
Diese Frage wurde hier beantwortet:
Kurze Antwort ist ja, es gibt eine Beziehung. Obwohl die Beziehung nicht so trivial ist, kann ich Ihnen nur sagen, dass Sie sehen, dass die Optimierungsoberfläche mit zunehmender Anzahl versteckter Ebenen komplexer wird und daher kleinere Lernraten im Allgemeinen besser sind. Während das Festhalten an lokalen Minima eine Möglichkeit mit niedriger Lernrate ist, ist es viel besser als komplexe Oberflächen und hohe Lernraten.
quelle