Es gibt mehrere Möglichkeiten, um Probleme beim Spielen zu lösen. Einige Spiele können beispielsweise durch Suchalgorithmen gelöst werden. Dies funktioniert gut für Karten- und Brettspiele bis zu einem gewissen Grad an Komplexität. Zum Beispiel war IBMs Deep Blue im Wesentlichen eine schnelle heuristische Suche nach optimalen Bewegungen.
Der wahrscheinlich allgemeinste Algorithmus für maschinelles Lernen zum Trainieren eines Agenten zur optimalen Ausführung einer Aufgabe ist jedoch das verstärkte Lernen . Technisch gesehen ist es nicht ein Algorithmus, sondern eine erweiterte Familie verwandter Algorithmen, die alle eine spezifische Formalisierung des Lernproblems lösen.
Informell geht es beim Reinforcement Learning (RL) darum, optimale Lösungen für Probleme zu finden, die in Bezug auf einen Agenten definiert sind, der den Zustand einer Umgebung beobachten , Maßnahmen in dieser Umgebung ergreifen und Belohnungen erfahren kann, die in irgendeiner Weise mit dem Zustand und den Maßnahmen zusammenhängen. RL-Löser müssen so konzipiert sein, dass sie Situationen bewältigen, in denen Belohnungen später eingehen als zu dem Zeitpunkt, als wichtige Maßnahmen ergriffen wurden. Dies wird normalerweise dadurch erreicht, dass der Algorithmus eine interne Erwartung späterer Belohnungen lernt, die mit Zustands- und / oder Zustands-Aktions-Paaren verbunden sind.
Hier sind einige Ressourcen zum Studium des Reinforcement Learning:
Sie werden feststellen, dass das Thema selbst ziemlich groß ist, da immer ausgefeiltere Variationen der Algorithmen erforderlich sind, da das zu lösende Problem schwieriger wird.
Das Starten von Spielen zum Lernen von Verstärkungslernen kann Folgendes umfassen:
Tik-Tac-Toe (auch bekannt als Nullen und Kreuze) - dies kann leicht mithilfe der Suche gelöst werden, aber es ist ein einfaches Spielzeugproblem, das mit grundlegenden RL-Techniken gelöst werden kann.
Labyrinthe - In der Literatur zum verstärkten Lernen gibt es viele Beispiele für "Grid World" -Spiele, bei denen sich ein Agent in einzelnen N-, E-, S- und W-Schritten auf einem kleinen Brett bewegt, das mit Gefahren und Zielen gefüllt sein kann.
Blackjack (auch bekannt als 21)
Wenn Sie mit Agenten zum Spielen von Videospielen zusammenarbeiten möchten, möchten Sie auch etwas über neuronale Netze lernen und wahrscheinlich auch einige Details - Sie benötigen tiefe, faltungsfähige neuronale Netze, um Bildschirmgrafiken zu verarbeiten.
Eine relativ neue Ressource für RL ist OpenAI Universe . Sie haben viel Arbeit geleistet, um Umgebungen zu verpacken, in denen Agenten geschult werden können, sodass Sie sich auf das Studium der Lernalgorithmen konzentrieren können, anstatt sich um die Einrichtung der Umgebung zu bemühen.
In Bezug auf Ihre Liste der aktuellen Fähigkeiten: Keine von ihnen ist direkt relevant für das verstärkte Lernen. Jedoch:
Wenn Sie die Mathematik und Theorie aus Ihrem vorherigen Kurs verstehen können, sollten Sie auch in der Lage sein, die Theorie des verstärkenden Lernens zu verstehen.
Wenn Sie online oder stapelüberwachte Lerntechniken studiert haben, können diese als Komponenten innerhalb eines RL-Frameworks verwendet werden. In der Regel können sie verwendet werden, um eine Wertefunktion des Spielstatus zu approximieren , basierend auf dem Feedback von bisherigen Erfolgen und Misserfolgen.