Ich erinnere mich, dass ich irgendwo gesehen / gelesen habe, dass es für SVMs mit mehreren Klassen und unausgeglichenen Daten eine Möglichkeit gab, die Klassengewichte aus den Trainingsdaten zu bestimmen (anstatt aus der X-Validierung). Weiß jemand, was die Methode ist oder aus welchem Papier sie stammt?
Vielen Dank
Antworten:
Für SVM, die die Zielfunktion minimiert Sie die Konstanten und wählen, die umgekehrt proportional zu den Klassengrößen sind. Das heißt, wenn Sie Trainingsmuster in Klasse 1 und - in Klasse 2 haben, nehmen Sie und so, dass = . Möglicherweise müssen Sie sie später in Ihren Experimenten leicht anpassen, dies ist jedoch eine gute Faustregel.C1C2L1L2C1C2C1/C2l2/l1
Wenn Sie das LIBSVM-Paket verwenden, können Sie und mit den Flags '' -w-1 '' und "-w1" angeben.C 2C.1 C.2
PS Ich habe gerade bemerkt, dass Sie nach einem Problem mit mehreren Klassen gefragt haben. Vielleicht finden Sie diese Antwort trotzdem hilfreich.
quelle