Adam hat eine einzelne Lernrate, aber es ist eine maximale Rate, die anpassungsfähig ist, daher denke ich nicht, dass viele Leute die Planung der Lernrate damit verwenden.
Aufgrund des adaptiven Charakters ist die Standardrate ziemlich robust, aber es kann vorkommen, dass Sie sie optimieren möchten. Was Sie tun können, ist, vorher eine optimale Ausfallrate zu finden, indem Sie mit einer sehr kleinen Rate beginnen und diese erhöhen, bis der Verlust nicht mehr abnimmt. Schauen Sie sich dann die Steigung der Verlustkurve an und wählen Sie die Lernrate aus, die mit der schnellsten Abnahme des Verlusts verbunden ist ( nicht der Punkt, an dem der Verlust tatsächlich am geringsten ist). Jeremy Howard erwähnt dies im Fast.ai Deep Learning-Kurs und aus dem Artikel Cyclical Learning Rates.
Bearbeiten: Die Leute haben vor relativ kurzer Zeit begonnen, in Zusammenarbeit mit Adam Richtlinien für die Lernrate in einem Zyklus zu verwenden, mit großartigen Ergebnissen.