Ich verwende die RBF-Kernelfunktion, um einen kernelbasierten Algorithmus für maschinelles Lernen (KLPP) zu implementieren. Die resultierende Kernelmatrix ist extrem schlecht konditioniert. Die Bedingungsnummer der L2-Norm lautet 1017-1064
Gibt es eine Möglichkeit, es gut konditioniert zu machen? Ich denke, Parameter muss eingestellt werden, aber ich weiß nicht genau, wie.
Vielen Dank!
Antworten:
Durch Verringern der wird normalerweise die Bedingungsnummer verringert.σm
Kernelmatrizen können jedoch für jede Basisfunktion oder Punktverteilung singulär oder nahezu singulär werden, vorausgesetzt, die Basisfunktionen überlappen sich. Der Grund dafür ist eigentlich ganz einfach:
Stellen Sie sich nun vor, Sie wählen zwei Punkte und und drehen sie langsam, sodass sie die Plätze wechseln. Währenddessen wechselt die Determinante von das Vorzeichen und wird irgendwann dazwischen Null. Zu diesem Zeitpunkt ist per Definition singulär.xi xj K K
quelle
Ein paar Vorschläge:
Wählen Sie die durchschnittliche Entfernung | zufälliges - am nächsten . (Eine billige Näherung für Punkte, die gleichmäßig im Einheitswürfel in , ist 0,5 / .) Wir wollen groß sein für Nähe von , klein für Hintergrundgeräusche; Zeichnen Sie das für ein paar zufällige .x x i N R d , d 2 . . 5 N 1 / d ϕ ( | x - x i | ) x i x xσ∼ x xi N Rd,d 2..5 N1/d
ϕ(|x−xi|) xi x x
Verschieben Sie von 0, , oder so; das heißt, regulieren.K → K + λ I λ ∼ 10 - 6K K→K+λI λ∼10−6
Schauen Sie sich die Gewichte aus der Lösung . Wenn einige immer noch riesig sind (unabhängig von der Bedingungsnummer), würde dies Boyd (unten) bestätigen, dass der Gaußsche RBF grundsätzlich schwach ist.(K+λI)w=f
(Eine Alternative zu RBF ist die Inverse-Distance-Gewichtung (IDW). Sie hat den Vorteil der automatischen Skalierung, die für die nächsten Entfernungen 1 2 3 wie für 100 200 300 Außerdem finde ich die explizite Benutzerauswahl von , der Zahl von nahen Nachbarn zu berücksichtigen, klarer als Rastersuche auf .)... N n e ein r σ , λ… … Nnear σ,λ
John P. Boyd, Die Nutzlosigkeit der schnellen Gauß-Transformation zur Summierung von Gaußschen radialen Basisfunktionsreihen , sagt
Hoffe das hilft; Bitte teilen Sie Ihre Erfahrungen.
quelle