Lehrbuch über Bestärkungslernen

12

Ich suche ein Lehrbuch / Vorlesungsskript zum Lernen der Verstärkung. Ich mag die "Einführung in das statistische Lernen" , aber leider wird dieses Thema nicht behandelt. Ich weiß, dass ein Buch von Sutton und Barto eine Standardreferenz ist, und vielleicht ist NDP auch gut, aber sie sind von 1997 bis 1998 datiert, und ich hatte gehofft, eine modernere Ausstellung zu finden, da dieses Gebiet in letzter Zeit wahrscheinlich eine gewisse Entwicklung haben wird Zeit.

Ulysses
quelle

Antworten:

15

Ich denke, Sutton und Barto sind immer noch der Standard. Es sind viele Dia-Decks und Notizen aus KI-Klassen online, aber sie gehen normalerweise nicht zu sehr ins Detail.

Sutton und Barto sind ein bisschen alt, aber sie bereiten eine zweite Ausgabe ihres Lehrbuchs vor. Ein Entwurf vom Januar 2018 ist hier verfügbar . Es ist von Suttons Webseite verlinkt , die auch den vollständigen Text der ersten Ausgabe enthält.

TD (λ) , gegenüber sieben Chapers und 150 Seiten im neueren Sutton und Barto.

Abgesehen davon könnten Sie versuchen, in einige Artikel einzutauchen - das Lernmaterial zur Verstärkung ist in der Regel ziemlich zugänglich.

Matt Krause
quelle
Danke, ich habe mir die neue Ausgabe angesehen, aber ich würde nicht sagen, dass sie sehr aktualisiert ist. Ich bin immer noch an einer aktuelleren Belichtung interessiert.
Ulysses
Ja, es ist definitiv keine vollständige Überarbeitung, aber außer einigen Bänden von Springers "Lecture Notes", die im Wesentlichen nur Sammlungen von Papieren sind, fällt mir nichts anderes ein. Wenn Sie etwas anderes finden, veröffentlichen Sie bitte ein Update. Ich würde es gerne ausprobieren.
Matt Krause
Ich sehe, sicher werde ich tun
Ulysses
1
@ CharlieParker, ich bin nicht sicher. Der jüngste Entwurf (19. Juni 2017) sieht ziemlich vollständig aus und erwähnt MIT Press, aber die MIT Press-Website scheint die erste Ausgabe noch zu verkaufen. Der Entwurf stammt direkt von der öffentlichen Website der Autoren, sodass Sie sich keine Gedanken über die Verwendung einer "durchgesickerten" Version oder Ähnlichem machen müssen.
Matt Krause
1
@ Thomas, ich habe den Link mit einem neueren Entwurf aktualisiert.
Matt Krause
6

Vielleicht möchten Sie sich die Algorithmen für das Reinforcement Learning von Csaba Szepesvári ansehen, die 2010 veröffentlicht wurden. PDF kann von der Website heruntergeladen werden. Meiner Meinung nach ist es etwas technischer als Sutton und Barto, deckt aber weniger Material ab.

wij
quelle
6

Hier haben Sie einige gute Lehrbücher / Referenzen:

Klassisch

Sutton RS, Barto AG. Reinforcement Learning: Eine Einführung. Cambridge, Mass: Ein Bradford-Buch; 1998. 322 p.

Der Entwurf für die zweite Ausgabe ist kostenlos erhältlich: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

Russell / Norvig Kapitel 21:

Russell SJ, Norvig P, Davis E. Künstliche Intelligenz: ein moderner Ansatz. Upper Saddle River, New Jersey: Prentice Hall; 2010.

Technischer

Szepesvári C. Algorithmen zum verstärkten Lernen. Synthesevorträge zu künstlicher Intelligenz und maschinellem Lernen. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Dynamische Programmierung und optimale Steuerung. 4. Auflage. Belmont, Mass.: Athena Scientific; 2007. 1270 p. Kapitel 6, Band 2 ist kostenlos verfügbar: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Für neuere Entwicklungen

Wiering M, van Otterlo M, Herausgeber. Verstärkungslernen. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Verfügbar ab: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Entscheidungsfindung unter Unsicherheit: Theorie und Anwendung. 1 Ausgabe. Cambridge, Massachusetts: Die MIT-Presse; 2015. 352 p.

Multi-Agent-Verstärkungslernen

Buşoniu L, Babuška R, Schutter BD. Multi-Agent Reinforcement Learning: Ein Überblick. In: Srinivasan D, Jain LC, Herausgeber. Innovationen in Multi-Agent-Systemen und -Anwendungen - 1. Springer Berlin Heidelberg; 2010 p. 183–221. Verfügbar unter: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Maschinelles Lernen mit mehreren Agenten: ein Ansatz zur Verstärkung. Hoboken, New Jersey: Wiley Wiley; 2014.

Videos / Kurse

Ich würde auch David Silver Kurs in YouTube vorschlagen: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

Juan Leni
quelle
3

Meine Lieblingsvorträge zum Thema Verstärkungslernen stammen von Andrew Ng in Stanfords Kurs über ML CS229:

Lernnotizen zur Wiederbelebung Stanford CS229

Sie können die Vorlesungsvideos auch auf iTunes herunterladen. Oder auf Youtube beginnen sie unter folgendem Link:

Vorlesung 16 CS229

Charlie Parker
quelle