Nach meinem Verständnis Ihrer Frage möchten Sie wissen, ob inverse Kinematik und Verstärkungslernen versuchen, dasselbe Problem im speziellen Fall der Robotermanipulation zu lösen. Natürlich können diese beiden Techniken auch außerhalb dieses speziellen Bereichs angewendet werden, aber konzentrieren wir uns zunächst auf die Manipulation von Robotern.
Sie haben Recht, dass die inverse Kinematik versucht, eine Lösung zu finden, obwohl dies eine Familie von Lösungen sein kann. Sie möchten den Endeffektor Ihres Manipulators in einer bestimmten Position positionieren und müssen den Zustand des restlichen Arms herausfinden, um die Bewegungen auszuführen, die Ihr Ziel erreichen.
Reinforcement Learning versucht auch, eine Lösung für das Problem zu finden, und versucht, seine Lösung in Bezug auf eine Kostenfunktion zu optimieren. Stellen Sie sich zum Beispiel vor, dass es nur eine minimale Anzahl von Bewegungen gibt, die Ihren Endeffektor in die erforderliche Position bringen würden (z. B. indem Sie Kosten für die Betätigung der einzelnen Gelenke des Manipulators anbringen, können Sie lernen, wie Sie Ihr Ziel in Bezug auf die Leistung optimal erreichen können verbraucht).
Anstatt zu berücksichtigen, dass die Techniken im Widerspruch zueinander stehen, können Sie mithilfe der inversen Kinematik die Lösungsfamilie für Ihr Problem finden und lernen, diesen Bereich zu durchsuchen und eine optimale Lösung in Bezug auf einige Kosten- / Ertragskriterien Ihrer Wahl zu finden .
Wenn Sie beabsichtigen, eine Technik der anderen vorzuziehen, indem Sie das Problem des Verstärkungslernens als Optimierung darstellen, die beispielsweise belohnt, wie schnell Sie den Zielzustand des Endeffektors erreichen, können Sie dennoch eine Lösung finden. Es besteht jedoch die Möglichkeit, dass Sie eine Vorstellung von der Kinematik des Manipulators verwenden möchten, um zu erfahren, wie Sie den Raum seiner Bewegungen durchsuchen.