Mehrere Kernel-Lernmethoden zielen darauf ab, ein Kernelmodell zu erstellen, bei dem der Kernel eine lineare Kombination von Kerneln mit fester Basis ist. Das Erlernen des Kernels besteht dann darin, die Gewichtungskoeffizienten für jeden Basiskern zu lernen, anstatt die Kernelparameter eines einzelnen Kernels zu optimieren.
Die Nachteile des Lernens mehrerer Kernel scheinen darin zu liegen, dass sie weniger interpretierbar und rechenintensiv sind (um die Modellausgabe zu bewerten, müssen Sie alle Basiskerne bewerten). Wenn also eine ähnliche Leistung durch einfaches Optimieren eines einzelnen Kernels erzielt werden kann, welche Vorteile bietet MKL?
machine-learning
svm
kernel-trick
Dikran Beuteltier
quelle
quelle
Antworten:
Es gibt zwei Vorteile (oder vielmehr zwei Anwendungsfälle):
Für jede Anwendung von SVMs muss ein Benutzer auswählen, welcher Kernel verwendet werden soll, und manchmal sogar seine eigenen Kernelmatrizen entwerfen. Ist es möglich, die Auswahl von Kerneln oder speziellen Kernel-Designs zu vereinfachen? MKL war ein Schritt in diese Richtung.
Der zweite Fall ist meiner Meinung nach ein weitaus überzeugenderer Fall. Beachten Sie, dass Ihre Dateneingabe Videodaten + cc ist. Die Funktionsdarstellung jedes Videos besteht aus Videofunktionen, Audiofunktionen und Textfunktionen. Solche Daten sind als multimodale Daten bekannt. Jeder Satz dieser Funktionen erfordert möglicherweise einen anderen Ähnlichkeitsbegriff (einen anderen Kernel). Ist es möglich, einen Kernel für jeden dieser Modi zu definieren und linear zu kombinieren, anstatt einen speziellen Kernel für solche Anwendungen zu erstellen?
quelle