Kann mir bitte jemand eine Vorstellung davon geben, wann ich mich für SVM oder LR entscheiden soll? Ich möchte die Intuition hinter dem Unterschied zwischen den Optimierungskriterien für das Erlernen der Hyperebene der beiden verstehen, wobei die jeweiligen Ziele wie folgt lauten:
- SVM: Versuchen Sie, den Abstand zwischen den nächstgelegenen Unterstützungsvektoren zu maximieren
- LR: Maximiere die Wahrscheinlichkeit der hinteren Klasse
Betrachten wir den linearen Merkmalsraum für SVM und LR.
Einige Unterschiede, die ich bereits kenne:
- SVM ist deterministisch (aber wir können das Platts-Modell für die Wahrscheinlichkeitsbewertung verwenden), während LR probabilistisch ist.
- Für den Kernelraum ist SVM schneller (speichert nur Unterstützungsvektoren)
regression
logistic
svm
optimization
user41799
quelle
quelle
Antworten:
Lineare SVMs und logistische Regression sind in der Praxis in der Regel vergleichbar. Verwenden Sie SVM mit einem nichtlinearen Kernel, wenn Sie Grund zur Annahme haben, dass Ihre Daten nicht linear trennbar sind (oder Sie müssen für Ausreißer robuster sein, als LR normalerweise toleriert). Versuchen Sie andernfalls zunächst die logistische Regression und sehen Sie, wie Sie mit diesem einfacheren Modell umgehen. Wenn die logistische Regression fehlschlägt, versuchen Sie es mit einer SVM mit einem nichtlinearen Kernel wie einer RBF.
BEARBEITEN:
Ok, lassen Sie uns darüber sprechen, woher die objektiven Funktionen kommen.
Die logistische Regression stammt aus der verallgemeinerten linearen Regression. Eine gute Diskussion der logistischen Regressionszielfunktion in diesem Zusammenhang finden Sie hier: https://stats.stackexchange.com/a/29326/8451
Der Support Vector Machines-Algorithmus ist viel geometrischer motiviert . Anstatt ein probabilistisches Modell anzunehmen, versuchen wir, eine bestimmte optimale Trennungs-Hyperebene zu finden, in der wir "Optimalität" im Kontext der Unterstützungsvektoren definieren. Wir haben nichts, was dem statistischen Modell ähnelt, das wir hier für die logistische Regression verwenden, auch wenn der lineare Fall ähnliche Ergebnisse liefert: Dies bedeutet nur, dass die logistische Regression ziemlich gute Arbeit bei der Erzeugung von "Wide Margin" -Klassifikatoren leistet, da dies der Fall ist Alles, was SVM versucht (insbesondere versucht SVM, den Abstand zwischen den Klassen zu "maximieren").
Ich werde versuchen, später darauf zurückzukommen und etwas tiefer in das Unkraut einzutauchen. Ich bin nur irgendwie in der Mitte von etwas: p
quelle
Bild zeigt den Unterschied zwischen SVM und logistischer Regression und wo welche Methode angewendet werden soll
Dieses Bild stammt aus dem Coursera-Kurs: "Machine Learning" von Andrew NG. Es befindet sich in Woche 7 am Ende von: "Support vector machines - using a SVM"
quelle
Sehen Sie sich Support Vector Machines vs. Logistic Regression an der University of Toronto CSC2515 von Kevin Swersky an.
quelle