Beim Verstärkungslernen wird häufig eine lineare Funktionsnäherung verwendet, wenn große Zustandsräume vorhanden sind. (Wenn Nachschlagetabellen nicht mehr durchführbar sind.)
Die Form des Wertes mit linearer Funktionsnäherung ist gegeben durch
Dabei sind die Gewichte und f i die Merkmale.
Die Funktionen werden vom Benutzer vordefiniert. Meine Frage ist, wie sind die Gewichte zugeordnet?
Ich habe einige Vorlesungsfolien auf Lesen / heruntergeladen Lernen mit Funktionsapproximation. Die meisten von ihnen haben Folien zur linearen Regression, die folgen. Da es sich nur um Folien handelt, sind sie in der Regel unvollständig. Ich frage mich, was die Verbindung / Beziehung zwischen den beiden Themen ist.