Ist betreutes Lernen eine Untergruppe des Bestärkungslernens?

16

Es scheint, als ob die Definition des überwachten Lernens eine Teilmenge des verstärkenden Lernens ist, mit einer bestimmten Art von Belohnungsfunktion, die auf beschrifteten Daten basiert (im Gegensatz zu anderen Informationen in der Umgebung). Ist das eine genaue Darstellung?

allstar
quelle

Antworten:

24

Es ist wahr, dass jedes überwachte Lernproblem als äquivalentes Verstärkungslernproblem gewertet werden kann: Lassen Sie die Zustände den Eingabedaten entsprechen. Lassen Sie Aktionen Vorhersagen der Ausgabe entsprechen. Definieren Sie Belohnung als das Negativ der Verlustfunktion, die für überwachtes Lernen verwendet wird. Maximieren Sie die erwartete Belohnung. Im Gegensatz dazu können Lernprobleme bei der Verstärkung im Allgemeinen nicht als überwachte Lernprobleme gewertet werden. Aus dieser Perspektive sind überwachte Lernprobleme eine Untergruppe von Problemen des verstärkten Lernens.

Der Versuch, ein betreutes Lernproblem mit einem allgemeinen Algorithmus für das verstärkte Lernen zu lösen, wäre jedoch ziemlich sinnlos. Alles, was dies bewirkt, ist, Strukturen wegzuwerfen, die die Lösung des Problems erleichtert hätten. Beim verstärkten Lernen treten verschiedene Probleme auf, die für überwachtes Lernen nicht relevant sind. Und betreutes Lernen kann von Ansätzen profitieren, die in der allgemeinen Lernumgebung für Verstärkung nicht zutreffen. Obwohl es einige gemeinsame Prinzipien und gemeinsame Techniken zwischen den Bereichen gibt, wird überwachtes Lernen in der Regel nicht als eine Art des verstärkenden Lernens betrachtet.

Verweise

Barto und Dietterich (2004) . Stärkung des Lernens und seiner Beziehung zu überwachtem Lernen.

user20160
quelle