A priori Auswahl der SVM-Klassengewichte

Ich erinnere mich, dass ich irgendwo gesehen / gelesen habe, dass es für SVMs mit mehreren Klassen und unausgeglichenen Daten eine Möglichkeit gab, die Klassengewichte aus den Trainingsdaten zu bestimmen (anstatt aus der X-Validierung). Weiß jemand, was die Methode ist oder aus welchem Papier sie stammt?

Vielen Dank

machine-learning svm unbalanced-classes tomas
quelle

Haben Sie eine gute Lösung für Multiclass-SVM gefunden?

Vam

Antworten:

Für SVM, die die Zielfunktion minimiert Sie die Konstanten und wählen, die umgekehrt proportional zu den Klassengrößen sind. Das heißt, wenn Sie Trainingsmuster in Klasse 1 und - in Klasse 2 haben, nehmen Sie und so, dass = . Möglicherweise müssen Sie sie später in Ihren Experimenten leicht anpassen, dies ist jedoch eine gute Faustregel.

\frac{1}{2} | | w | |^{2} + {C.}_{1} \sum_{ξ_{ich} :: y_{ich} = - - 1}^{l} ξ_{ich} + {C.}_{2} \sum_{ξ_{ich} :: y_{ich} = 1}^{l} ξ_{ich}

$\frac{1}{2}||w||^2 + C_1 \sum_{\xi_i: y_i=-1}^{l}\xi_i + C_2 \sum_{\xi_i: y_i=1}^{l}\xi_i$

C_{1}

$C_1$

C_{2}

$C_2$

l_{1}

$l_1$

l_{2}

$l_2$

C_{1}

$C_1$

C_{2}

$C_2$

C_{1} / C_{2}

$C_1/C_2$

l_{2} / l_{1}

$l_2/l_1$

Wenn Sie das LIBSVM-Paket verwenden, können Sie und mit den Flags '' -w-1 '' und "-w1" angeben. $C_1$ $C_2$

PS Ich habe gerade bemerkt, dass Sie nach einem Problem mit mehreren Klassen gefragt haben. Vielleicht finden Sie diese Antwort trotzdem hilfreich.

Löwe
quelle