Ich versuche die berühmte Zeitung "Atari spielen mit Deep Reinforcement Learning" ( pdf ) zu verstehen . Mir ist der Unterschied zwischen einer Epoche und einer Episode unklar . In Algorithmus befindet sich die äußere Schleife über Episoden , während in Abbildung 2 die x-Achse als Epoche bezeichnet ist . Im Zusammenhang mit dem verstärkten Lernen ist mir nicht klar, was eine Epoche bedeutet. Ist eine Epoche eine äußere Schleife um die Episodenschleife?
14
Antworten:
In dem von Ihnen erwähnten Artikel scheinen sie hinsichtlich der Bedeutung der Epoche flexibler zu sein, da sie nur eine Epoche als eine bestimmte Anzahl von Gewichtsaktualisierungen definieren. Sie können daher eine Epoche als äußere Schleife um die Episodenschleife betrachten, wie Sie in der Frage erwähnt haben.
quelle