Ich muss URLs in Kategorien einteilen. Angenommen, ich habe 15 Kategorien, für die ich vorhabe, jede URL auf null zu setzen.
Ist ein 15-Wege-Klassifikator besser? Wobei ich 15 Labels habe und Features für jeden Datenpunkt generiere.
Oder bauen Sie 15 binäre Klassifizierer auf, sagen Sie: Film oder Nicht-Film, und verwenden Sie die Zahlen, die ich aus diesen Klassifizierungen erhalte, um einen Rang zu bilden, um die beste Kategorie auszuwählen, die besser wird?
Dies hängt davon ab, wie Ihre Daten verteilt sind. Es gibt ein schönes Beispiel, das kürzlich zu einer ähnlichen Frage gegeben wurde, in der das OP wissen wollte, ob eine einzelne lineare Diskriminanzfunktion ein besserer Klassifikator für die Entscheidung von Population A gegen B oder C ist oder auf mehreren linearen Diskriminanzfunktionen basiert, die A trennen. B und C. Jemand gab ein sehr schönes farbiges Streudiagramm ab, um zu zeigen, wie die Verwendung von zwei Diskriminanten in diesem Fall besser wäre als eine. Ich werde versuchen, darauf zu verlinken.
quelle
Einige Methoden eignen sich gut für Multiklassen, Zufallsforste und MLPs.
Wenn Sie diesen Weg nicht einschlagen möchten, ist es möglich, dass ECOC für Ihr Problem eine 1-gegen-alle-Leistung erbringt, die nur durch Tests ermittelt werden kann.
quelle