Fernüberwachung: überwacht, halb überwacht oder beides?

20

"Fernüberwachung" ist ein Lernschema, bei dem ein Klassifikator anhand eines schwach gekennzeichneten Trainingssatzes gelernt wird (Trainingsdaten werden automatisch anhand von Heuristiken / Regeln gekennzeichnet). Ich denke, dass sowohl beaufsichtigtes Lernen als auch semi-beaufsichtigtes Lernen eine solche "Fernüberwachung" beinhalten können, wenn ihre beschrifteten Daten heuristisch / automatisch beschriftet sind. Auf dieser Seite wird "Fernüberwachung" jedoch als "halbüberwachtes Lernen" definiert (dh auf "halbüberwachtes Lernen" beschränkt).

Meine Frage ist also, bezieht sich "Fernaufsicht" ausschließlich auf Halbaufsicht? Meiner Meinung nach kann es sowohl für betreutes als auch für semi-betreutes Lernen angewendet werden. Bitte geben Sie ggf. verlässliche Referenzen an.

AM2
quelle

Antworten:

22

Ein entfernter Überwachungsalgorithmus hat in der Regel die folgenden Schritte:
1] Es kann einige Trainingsdaten markiert haben
2] Es „hat“ Zugriff auf einen Pool von nicht markierten Daten
3] Es hat einen Operator, den es auf Probe aus diesen unmarkierten Daten ermöglicht und beschriften und es wird erwartet, dass dieser Bediener in seinen Bezeichnungen verrauscht ist.
4] Der Algorithmus verwendet dann gemeinsam die ursprünglich gekennzeichneten Trainingsdaten, falls vorhanden, und diese neuen verrauscht gekennzeichneten Daten, um die endgültige Ausgabe zu erhalten.

Um Ihre Frage zu beantworten, sind sowohl Sie als auch die Website korrekt. Sie betrachten den 4. Schritt des Algorithmus und stellen fest, dass im 4. Schritt jeder Algorithmus verwendet werden kann, auf den der Benutzer Zugriff hat. Daher Ihr Standpunkt: "Es kann sowohl auf betreutes als auch auf halb betreutes Lernen angewendet werden . "

Während die Site alle Schritte 1 bis 4 zusammen betrachtet und feststellt, dass die geräuschbehafteten Daten aus einem Pool nicht etikettierter Daten (mit oder ohne Verwendung einiger bereits vorhandener etikettierter Trainingsdaten) und diesem Prozess des Erlangens geräuschbehafteter Daten stammen eine wesentliche Komponente für jeden entfernten Überwachungsalgorithmus ist, damit es ist ein halb- überwachtes Algorithmus.

TenaliRaman
quelle