Wird bei Verwendung von SVM als binärer Klassifikator die Bezeichnung für einen Datenpunkt im Konsens ausgewählt?

9

Ich lerne Support Vector Machines und kann nicht verstehen, wie eine Klassenbezeichnung für einen Datenpunkt in einem binären Klassifikator ausgewählt wird. Wird es im Konsens hinsichtlich der Klassifizierung in jeder Dimension der trennenden Hyperebene gewählt?

gc5
quelle

Antworten:

9

Der Begriff Konsens wird meines Erachtens eher für Fälle verwendet, in denen Sie mehr als eine Quelle für Metrik / Maß / Auswahl haben, aus der Sie eine Entscheidung treffen können. Um ein mögliches Ergebnis auszuwählen, führen Sie eine durchschnittliche Bewertung / einen Konsens über die verfügbaren Werte durch.

Dies ist bei SVM nicht der Fall. Der Algorithmus basiert auf einer quadratischen Optimierung , die den Abstand zu den nächstgelegenen Dokumenten zweier verschiedener Klassen maximiert und eine Teilung verwendet, um die Aufteilung vorzunehmen.

Hyperebene, die zwei verschiedene Klassen trennt

Der einzige Konsens hier ist also die resultierende Hyperebene, die aus den nächstgelegenen Dokumenten jeder Klasse berechnet wird. Mit anderen Worten, die Klassen werden jedem Punkt zugeordnet, indem der Abstand vom Punkt zur abgeleiteten Hyperebene berechnet wird. Wenn der Abstand positiv ist, gehört er zu einer bestimmten Klasse, andernfalls gehört er zu der anderen.

Rubens
quelle