Ich möchte ein webbasiertes Online-System für maschinelles Lernen aufbauen, in dem Benutzer kontinuierlich klassifizierte Stichproben hinzufügen und das Modell online aktualisieren können. Ich möchte ein Perzeptron oder einen ähnlichen Online-Lernalgorithmus verwenden.
Benutzer können jedoch Fehler machen und irrelevante Beispiele einfügen. In diesem Fall möchte ich die Option haben, ein bestimmtes Beispiel zu löschen, ohne das Perzeptron für die gesamte Menge von Beispielen (die sehr groß sein kann) neu zu trainieren.
Ist das möglich?
machine-learning
online-algorithms
Erel Segal-Halevi
quelle
quelle
Antworten:
Nach meinem Verständnis ist es unmöglich, ein Perzeptron ohne Umschulung zu verändern. Die Gewichtsanpassungen beziehen sich nicht nur auf dieses spezielle Beispiel, sondern auch auf die anderen Trainingsbeispiele, die zuvor ausgeführt wurden. Das Erkennen der falsch klassifizierten Instanz und das Entfernen dieser Instanz aus dem Testset vor dem erneuten Trainieren des Modells scheint die effektivste Methode zur Korrektur der Gewichte zu sein.
Ich denke, es ist erwähnenswert, dass Perceptrons im Vergleich zu anderen Algorithmen für maschinelles Lernen relativ rauschresistent sind und falsch klassifizierte Instanzen im Trainingssatz aufweisen . Wenn Sie auf eine große Anzahl von falsch klassifizierten Instanzen stoßen, ist es ratsamer, eine bessere Validierung an dem Punkt vorzunehmen, an dem Sie die Daten vor dem Training erfassen, als nach dem Training des Perceptrons eine Möglichkeit zur Korrektur von falsch klassifizierten Instanzen zu finden. Wenn dies nicht möglich ist und Sie in der Lage sind, die falsch klassifizierten Instanzen als solche zu identifizieren, kann die Auswirkung der falsch klassifizierten Instanzen nur durch Entfernen und erneutes Trainieren effektiv beseitigt werden.
quelle