Wie man die Wirkung von RBF SVM versteht

17

Wie kann ich verstehen, was der RBF-Kernel in SVM macht? Ich meine, ich verstehe die Mathematik, aber gibt es eine Möglichkeit, ein Gefühl dafür zu bekommen, wann dieser Kernel nützlich sein wird?

Wären die Ergebnisse von kNN mit SVM / RBF verbunden, da die RBF Vektorabstände enthält?

Gibt es eine Möglichkeit, ein Gefühl für den Polynomkern zu bekommen? Ich weiß, je höher die Dimension, desto wackeliger ist es. Aber ich möchte eine Vorstellung davon bekommen, was die Kernel tun, anstatt alle möglichen Kernel auszuprobieren und die erfolgreichsten auszuwählen.

Gerenuk
quelle

Antworten:

29

Sie können möglicherweise mit einer meiner Antworten beginnen:
Nichtlineare SVM-Klassifizierung mit RBF-Kernel

In dieser Antwort versuche ich zu erklären, was eine Kernelfunktion versucht zu tun. Wenn Sie wissen, was es versucht, lesen Sie meine Antwort auf eine Frage zu Quora: https://www.quora.com/Machine-Learning/Why-does-the-RBF- Radial-Basis-Funktion-Kernel-Karte-in-unendlichen-dimensionalen-Raum / Antwort / Arun-Iyer-1

Reproduzieren Sie den Inhalt der Antwort auf Quora, falls Sie keinen Quora-Account haben.

Frage: Warum wird der RBF-Kernel (Radial Base Function) in den unendlichen dimensionalen Raum abgebildet? Antwort: Betrachten Sie den Polynomkern vom Grad 2, der durch wobei x , y R 2 und x = ( x 1 , x 2 ) , y = ( y 1 , y 2 ) .

k(x,y)=(xTy)2
x,yR2x=(x1,x2),y=(y1,y2)

Dadurch kann die Kernelfunktion wie geschrieben werden: k ( x , y ) = ( x 1 y 1 + x 2 y 2 ) 2 = x 2 1 y 2 1 + 2 x 1 x 2 y 1 y 2 + x 2 2 y 2 2 Lassen Sie uns nun versuchen, eine Feature-Map Φ zu erstellen, bei der die Kernelfunktion als k ( x ,

k(x,y)=(x1y1+x2y2)2=x12y12+2x1x2y1y2+x22y22
Φ .k(x,y)=Φ(x)TΦ(y)

Betrachten Sie die folgende Feature-Map: Grundsätzlich werden bei dieser Feature-Map die Punkte in R 2auf Punkte in R 3abgebildet. Beachten Sie auch, dassΦ(x)TΦ(y)=x 2 1 y 2 1 +2x1x2y1y2+x 2 2 y 2 2, was im Wesentlichen unsere Kernelfunktion ist.

Φ(x)=(x12,2x1x2,x22)
R2R3
Φ(x)TΦ(y)=x12y12+2x1x2y1y2+x22y22

Dies bedeutet, dass unsere Kernelfunktion tatsächlich das Innen- / Punktprodukt von Punkten in berechnet . Das heißt, es werden implizit unsere Punkte von R 2 auf R 3 abgebildet .R3R2R3

Übungsfrage : Wenn Ihre Punkte in , ordnet ein Polynomkern von Grad 2 sie implizit einem Vektorraum F zu. Welche Dimension hat dieser Vektorraum F? Hinweis: Alles, was ich oben getan habe, ist ein Hinweis.Rn

Kommen wir jetzt zu RBF.

R2

k(x,y)=exp(-x-y2)=exp(-(x1-y1)2-(x2-y2)2)
=exp(-x12+2x1y1-y12-x22+2x2y2-y22)
=exp(-x2)exp(-y2)exp(2xTy)
k(x,y)=exp(-x2)exp(-y2)n=0(2xTy)nn!
ΦR2

Übungsfrage : Erhalten Sie die ersten Vektorelemente der Feature-Map für RBF für den obigen Fall?

Nun können wir aus der obigen Antwort etwas schließen:

  • Φ
  • ΦR2Φ(x)=(x12,2x1x2,x22)
TenaliRaman
quelle