In SVM ist der Gaußsche Kern wie folgt definiert: wobei x, y \ in \ mathbb {R ^ n} . Ich kenne die explizite Gleichung von \ phi nicht . Ich will es wissen.x,y∈Rnφ
Ich möchte auch wissen, ob
wobei . Jetzt denke ich, dass es nicht gleich ist, weil die Verwendung eines Kernels die Situation handhabt, in der der lineare Klassiker nicht funktioniert. Ich kenne Projekte x zu einem unendlichen Raum. Also, wenn es immer noch linear bleibt, egal wie viele Dimensionen es sind, kann svm immer noch keine gute Klassifizierung vornehmen.
machine-learning
svm
kernel-trick
Vivian
quelle
quelle
Antworten:
Sie können die explizite Gleichung vonϕ für den Gaußschen Kernel über die Erweiterung der Tailor-Reihe von ex . Nehmen Sie zur Vereinfachung der Notation an, dass x ∈ R1 :
Dies wird auch in diesen Folien von Chih-Jen Lin von NTU (Folie 11 speziell) ausführlicher erörtert . Beachten Sie, dass in den Folien als Kernelparameter verwendet wird.γ=12σ2
Die Gleichung im OP gilt nur für den linearen Kernel.
quelle
Für jeden gültigen psd kernel , es existiert eine Merkmalskarte , so daß . Der Raum und die Einbettung in der Tat nicht eindeutig sein, aber es gibt ein wichtiges eindeutiges Paar das als reproduzierender Kernel-Hilbert-Raum (RKHS) bekannt ist. φ : X → H k ( x , y ) = ⟨ φ ( x ) , φ ( y ) ⟩ H H φ ( H , φ )k : X× X→ R φ : X→ H k ( x , y) = ⟨ Φ ( x ) , φ ( y) ⟩H H φ ( H , φ )
Das RKHS wird diskutiert von: Steinwart, Hush and Scovel, Eine explizite Beschreibung des reproduzierenden Kerns Hilbert-Räume von Gaußschen RBF-Kerns , IEEE-Transaktionen zur Informationstheorie 2006 ( doi , free citeseer pdf ).
Es ist etwas kompliziert, aber es läuft darauf hinaus: Definiere als e n ( z ) : = √en: C → C
Sei eine Folge, die sich über alle Tupel nichtnegativer Ganzzahlen erstreckt; wenn , vielleicht , , und so weiter. Bezeichne die te Komponente des ten Tupels mit . d d = 3 n ( 0 ) = ( 0 , 0 , 0 ) n ( 1 ) = ( 0 , 0 , 1 ) n ( 2 ) = ( 0 , 1 , 1 ) j i n i jn : N0→Nd0 d d=3 n(0)=(0,0,0) n(1)=(0,0,1) n(2)=(0,1,1) j i nij
Dann wird der - ten Komponente von ist . Also bildet Vektoren in auf unendlich dimensionale komplexe Vektoren ab.φ ( x ) Π d j = 1 e n i j ( x j ) φ R di φ(x) ∏dj=1enij(xj) φ Rd
Der Haken dabei ist, dass wir für diese unendlichdimensionalen komplexen Vektoren in besonderer Weise Normen definieren müssen; Einzelheiten finden Sie auf dem Papier.
Steinwart et al. Geben Sie auch eine (meiner nach) Einbettung in , den Hilbert-Raum der quadratintegrierbaren Funktionen von : Beachten Sie, dass selbst eine Funktion von bis . Es ist im Grunde die Dichte eines dimensionalen Gaußschen mit Mittelwert und Kovarianz ; nur die normalisierende Konstante ist anders. Also wenn wir nehmen R d → R Φ σ ( x ) = ( 2 σ ) dL2(Rd) Rd→R & Phi;& sgr;(x)RdRdx1
Dies sind nicht die einzigen Einbettungen, die funktionieren.
Ein anderes basiert auf der Fourier-Transformation, die sich dem berühmten Artikel von Rahimi und Recht ( Random Features for Large-Scale Kernel Machines , NIPS 2007) sehr gut annähert.
Sie können dies auch mit Taylor-Reihen tun: effektiv die unendliche Version von Cotter, Keshet und Srebro, Explicit Approximations of the Gaussian Kernel , arXiv: 1109.4603 .
quelle
Es scheint mir, dass Ihre zweite Gleichung nur dann wahr sein wird, wenn eine lineare Abbildung ist (und daher ein linearer Kern ist). Da der Gauß'sche Kern nicht linear ist, wird die Gleichheit nicht gelten (außer vielleicht in der Grenze, wenn auf Null geht).K σϕ K σ
quelle