Überwachtes Lernen
- 1) Ein menschliches baut einen Klassifizierer basierend auf Eingabe und Ausgabedaten
- 2) Dieser Klassifikator wird mit einem Trainingsdatensatz trainiert
- 3) Dieser Klassifikator wird mit einem Testdatensatz getestet
- 4) Bereitstellung, wenn die Ausgabe zufriedenstellend ist
Um verwendet zu werden, wenn "Ich weiß, wie man diese Daten klassifiziert, ich brauche nur Sie (den Klassifizierer), um sie zu sortieren."
Methodenkomponente: Zum Klassifizieren von Beschriftungen oder zum Erzeugen reeller Zahlen
Unbeaufsichtigtes Lernen
- 1) Ein menschliches baut einen Algorithmus basierend auf Eingangsdaten
- 2) Dieser Algorithmus wird mit einem Testdatensatz getestet (in dem der Algorithmus den Klassifikator erstellt).
- 3) Einsatz, wenn der Klassifikator zufriedenstellend ist
Um verwendet zu werden, wenn "Ich habe keine Ahnung, wie ich diese Daten klassifizieren soll. Können Sie (der Algorithmus) einen Klassifikator für mich erstellen?"
Methodenpunkt: Etiketten klassifizieren oder vorhersagen (PDF)
Verstärkung lernen
- 1) Ein menschliches baut einen Algorithmus basierend auf Eingangsdaten
- 2) Dieser Algorithmus stellt einen Zustand dar, der von den Eingabedaten abhängt, in denen ein Benutzer den Algorithmus über die vom Algorithmus ausgeführte Aktion belohnt oder bestraft. Dies setzt sich über die Zeit fort
- 3) Dieser Algorithmus lernt aus der Belohnung / Bestrafung und aktualisiert sich, dies geht weiter
- 4) Es ist immer in Produktion, es muss reale Daten lernen, um Aktionen von Staaten darstellen zu können
Zu verwenden, wenn: "Ich habe keine Ahnung, wie ich diese Daten klassifizieren soll. Können Sie diese Daten klassifizieren und ich werde Ihnen eine Belohnung geben, wenn sie korrekt sind, oder ich werde Sie bestrafen, wenn sie nicht korrekt sind."
Ist dies der Fluss dieser Praktiken? Ich höre viel darüber, was sie tun, aber die praktischen und beispielhaften Informationen sind erschreckend wenig!
quelle
Antworten:
Dies ist eine sehr schöne kompakte Einführung in die Grundideen!
Verstärkung lernen
Ich denke, dass Ihre Use-Case-Beschreibung des verstärkenden Lernens nicht genau richtig ist. Der Begriff klassifizieren ist nicht zutreffend. Eine bessere Beschreibung wäre:
Mit anderen Worten, das Ziel ist eher, etwas gut zu kontrollieren , als etwas gut zu klassifizieren .
Eingang
Algorithmus
Ausgabe
quelle
Haftungsausschluss: Ich bin kein Experte und habe (noch) nie etwas mit Verstärkung gelernt, daher wäre jedes Feedback willkommen ...
Hier ist eine Antwort, die Ihrer Liste ein paar winzige mathematische Notizen und einige andere Gedanken darüber hinzufügt, wann Sie was verwenden sollen. Ich hoffe, die Aufzählung ist selbsterklärend genug:
Überwacht
Einstellung für Klassifizierung und Regression
Unbeaufsichtigt
Einstellung für Clustering, Dimensionsreduktion, Auffinden versteckter Faktoren, generativer Modelle usw.
Verstärkung
Dies scheint besonders nützlich für sequentielle Entscheidungsaufgaben zu sein.
Literatur:
Si, J., Barto, A., Powell, W. und Wunsch, D. (2004) Bestärkungslernen und seine Beziehung zu überwachtem Lernen im Handbuch des Lernens und der ungefähren dynamischen Programmierung, John Wiley & Sons, Inc., Hoboken, New Jersey, USA. doi: 10.1002 / 9780470544785.ch2
quelle