Was ist im Zusammenhang mit maschinellem Lernen der Unterschied zwischen
- unbeaufsichtigtes Lernen
- betreutes Lernen und
- teilüberwachtes Lernen?
Und was sind einige der wichtigsten algorithmischen Ansätze?
Was ist im Zusammenhang mit maschinellem Lernen der Unterschied zwischen
Und was sind einige der wichtigsten algorithmischen Ansätze?
Antworten:
Im Allgemeinen können die Probleme des maschinellen Lernens als Variationen der Funktionsschätzung für die Klassifizierung, Vorhersage oder Modellierung betrachtet werden.
Beim betreuten Lernen wird man mit Input (x1 , x2 , ...) und Output ( y1 , y2 , ...) ausgestattet und aufgefordert, eine Funktion zu finden, die dieses Verhalten auf verallgemeinerbare Weise approximiert. Die Ausgabe kann eine Klassenbezeichnung (in Klassifizierung) oder eine reelle Zahl (in Regression) sein - dies ist die "Überwachung" beim überwachten Lernen.
Bei unbeaufsichtigtem Lernen erhalten Sie im Basisfall Eingabenx1 , x2 , ..., aber es werden weder Zielausgaben noch Belohnungen aus der Umgebung bereitgestellt. Basierend auf dem Problem (klassifizieren oder vorhersagen) und Ihrem Hintergrundwissen über den untersuchten Raum können Sie verschiedene Methoden anwenden: Dichteschätzung (Schätzen einiger zugrunde liegender PDFs für die Vorhersage), k-bedeutet Clustering (Klassifizieren unbeschrifteter reeller Daten), k- Clustering-Modi (Klassifizieren von nicht gekennzeichneten kategorialen Daten) usw.
Das teilüberwachte Lernen beinhaltet die Funktionsschätzung von markierten und unmarkierten Daten. Dieser Ansatz ist durch die Tatsache motiviert, dass die Erstellung von beschrifteten Daten häufig kostspielig ist, während dies bei nicht beschrifteten Daten im Allgemeinen nicht der Fall ist. Die Herausforderung hierbei besteht hauptsächlich in der technischen Frage, wie Daten auf diese Weise gemischt behandelt werden sollen. Weitere Informationen zu halbüberwachten Lernmethoden finden Sie in dieser halbüberwachten Lernliteraturumfrage.
Neben diesen Arten des Lernens gibt es noch andere, wie beispielsweise das verstärkte Lernen, bei dem die Lernmethode mit ihrer Umgebung interagiert, indem sie Aktionenein1 , ein2 ,. . .. die Belohnungen oder Bestrafungen hervorrufen r1 , r2 , ...
quelle
Unbeaufsichtigtes Lernen
Unbeaufsichtigtes Lernen liegt vor, wenn Sie keine beschrifteten Daten für das Training zur Verfügung haben. Beispiele hierfür sind häufig Clustering-Methoden.
Überwachtes Lernen
In diesem Fall bestehen Ihre Trainingsdaten aus beschrifteten Daten. Das Problem, das Sie hier lösen, besteht häufig darin, die Beschriftungen für Datenpunkte ohne Beschriftung vorherzusagen.
Teilüberwachtes Lernen
In diesem Fall werden sowohl beschriftete Daten als auch unbeschriftete Daten verwendet. Dies kann beispielsweise in Deep-Believe-Netzwerken verwendet werden, in denen einige Ebenen die Struktur der Daten lernen (unbeaufsichtigt) und eine Ebene für die Klassifizierung verwendet wird (trainiert mit überwachten Daten).
quelle
Ich denke nicht, dass beaufsichtigt / unbeaufsichtigt der beste Weg ist, darüber nachzudenken. Beim einfachen Data Mining sollten Sie sich überlegen, was Sie tun möchten. Es gibt vier Hauptaufgaben:
Prognose. Wenn Sie eine reelle Zahl vorhersagen, spricht man von einer Regression. Wenn Sie eine ganze Zahl oder Klasse vorhersagen, spricht man von Klassifizierung.
Modellieren. Modellierung ist dasselbe wie Vorhersage, aber das Modell ist für den Menschen verständlich. Neuronale Netze und Support-Vektor-Maschinen funktionieren gut, liefern jedoch keine nachvollziehbaren Modelle [1]. Entscheidungsbäume und klassische lineare Regression sind Beispiele für leicht verständliche Modelle.
Ähnlichkeit. Wenn Sie versuchen, natürliche Gruppen von Attributen zu finden, spricht man von einer Faktorenanalyse. Wenn Sie versuchen, natürliche Beobachtungsgruppen zu finden, spricht man von Clustering.
Verband. Es ähnelt in etwa der Korrelation, ist jedoch für enorme Binärdatensätze geeignet.
[1] Anscheinend hat Goldman Sachs Unmengen von großartigen neuronalen Netzen zur Vorhersage erstellt, aber dann hat niemand sie verstanden, und so mussten sie andere Programme schreiben, um zu versuchen, die neuronalen Netze zu erklären.
quelle