DeepMind gab an, dass sein Deep Q-Network (DQN) sein Verhalten kontinuierlich anpassen konnte, während es lernte, 49 Atari-Spiele zu spielen.
Nachdem der Agent alle Spiele mit demselben neuronalen Netz gelernt hatte, war er in der Lage, sie alle gleichzeitig auf "übermenschlichen" Ebenen zu spielen (wann immer es zufällig mit einem der Spiele präsentiert wurde) oder konnte es nur zu einem Spiel gleichzeitig gut sein, weil er wechselte Benötigen Sie ein Umlernen?
Antworten:
Das Umschalten erforderte ein erneutes Lernen.
Auch beachten Sie, dass :
und
quelle
Das Wechseln erfordert ein Umlernen. Das Netzwerk verfügte nicht über einen einzigen Satz von Gewichten, mit denen alle Spiele gut gespielt werden konnten. Dies ist auf das katastrophale Problem des Vergessens zurückzuführen.
In jüngster Zeit wurden jedoch Arbeiten durchgeführt, um dieses Problem zu lösen:
"Überwindung des katastrophalen Vergessens in neuronalen Netzen", 2016
Papier: https://arxiv.org/pdf/1612.00796v1.pdf
quelle