Ich bin sehr interessiert daran, wie AlphaGo resp. AlphaZero funktioniert. Mir scheint, die zugehörigen Google Papers sind sehr dicht und nicht leicht zu lesen.
Gibt es ein Lehrbuch oder eine Vorlesung, die auf technischer Ebene erklärt, wie das alles funktioniert? Dh beginnend mit neuronalen Netzen / Deep Learning, Monte-Carlo-Baumsuche bis zum Erreichen von AlphaGo / AlphaZero?
Ich habe einen Master in Informatik, aber ich habe nie mit künstlicher Intelligenz / maschinellem Lernen gearbeitet.
Im Moment scheint es mir, dass alle zugehörigen Informationen verstreut sind und ich keine Zeit habe, (Online-) Vorlesungen über maschinelles Lernen anzuhören, die vielleicht nur 10% darüber enthalten, was für das Verständnis von AlphaGo relevant ist ...
Kann mich jemand in die richtige Richtung weisen?
Antworten:
BEARBEITEN
Der Link von @ unutbu im Kommentar ist eine gute Einführung.
Solides Verständnis für AlphaZero erfordert höchstwahrscheinlich einen quantitativen Abschluss (PhD?). Fragen Sie nach einem Crashkurs in AlphaZero?
Bitte beachten Sie , dass nichts, was ich sage, funktioniert , wenn Sie nicht einen erheblichen Teil Ihrer Zeit investieren . Es gibt kein Buch, das möglicherweise alles abdecken kann. Sie müssen sehr hart arbeiten.
Probieren wir es aus. Crashkurs für AlphaZero.
1. Grundlegendes Verständnis beim maschinellen Lernen
Unzählige Bücher. Aber wenn Sie keine Zeit haben, würde ich Professor Andrew Ngs Kurse zum maschinellen Lernen auf Coursera empfehlen.
Ihre Schlüsselwörter: Trainingssätze, Testsätze, stochastischer Gradientenabstieg, Lernrate, GPU, Kostenfunktion, Kreuzentropie .
2. Tief neutrale Netzwerke
Sie müssen sich mit neuronalen Netzen auskennen. Ich würde Professor Ian Goodfellow das Deep-Learning-Buch empfehlen, wenn Sie es ernst meinen. Wenn Sie keine Zeit haben, folgen Sie bitte erneut dem Online-Kurs von Professor Andrew Ng über Coursera. Sie müssen nicht alle Kapitel durchgehen (aber Sie sollten!).
YouTube bietet viele schnelle Einführungen in neuronale Netze. Probieren Sie sie aus.
Ihre Schlüsselwörter: Neuron, Schichten, Gewichte, Voreingenommenheit, Mini-Batch, Aktivierung .
3. Monte-Carlo-Baumsuche
Sie sollten verstehen, was Monte Carlo ist. Bücher über Monte Carlo gibt es überall bei Amazon. Lesen Sie die Wikipedia über MCTS, wenn Sie keine Zeit haben.
Ihre Schlüsselwörter: Sampling, Erweiterung, Simulation, Rollouts, Backpropagation .
3. Verstärkungslernen
Ihre Schlüsselwörter: Richtliniengradient, Gradientenabstieg, Lernrate
5. Schachbrettdarstellung
Das Papier selbst ist am einfachsten. Das Modell codiert den Board-Status (z. B. Teile) als eine Reihe von One-Hot-Codierungs-Binärwerten.
6. MCTS gegen Alpha-Beta
quelle
Ich habe nicht genug Ruf, um einen Kommentar abzugeben , aber AlphaGo Zero Explained In One Diagram ist ziemlich gut.
Ich mag dieses Tutorial auch sehr.
Beachten Sie, dass der erste Link nicht beschreibt, wann Knoten erstellt (erweitert) werden sollen. Dieser Teil kann etwas verwirrend sein. Dieser Link kann helfen.
quelle
Diese Präsentation fasst die Reise zu AlphaGo zusammen
Dies ist eine Darstellung der zugrunde liegenden Theorie
Das ist das Buch
Und ich denke, alles in tiefen Faltungs-Neuronalen Netzen.
quelle