Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen?
Dieser Artikel kategorisiert sie in:
- Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden,
- Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt.
- Ensemble-Techniken: Umfasst kostensensitive Ensembles und Datenvorverarbeitung in Verbindung mit Ensemble-Lernen.
Die zweite Klassifikation:
- Datenvorverarbeitung: Beinhaltet Verteilungsänderungen und die Gewichtung des Datenraums. Ein-Klassen-Lernen wird als Verteilungsänderung betrachtet.
- Spezielle Lernmethoden
- Vorhersage Nachbearbeitung: Beinhaltet die Schwellenwertmethode und die kostensensitive Nachbearbeitung
- Hybridmethoden:
Der dritte Artikel :
- Methoden auf Datenebene
- Methoden auf Algorithmenebene
- Hybridmethoden
Die letzte Klassifizierung betrachtet die Leistungsanpassung auch als unabhängigen Ansatz.
Danke im Voraus.
Antworten:
So wie ich das sehe, stimmen alle drei Kategorisierungen in vielen Punkten überein. Beispielsweise haben alle drei eine Kategorie für Vorverarbeitungsschritte.
Ich würde mich eher auf die dritte Kategorisierung einigen, da sie allgemeiner ist und mehr Dinge umfasst.
Das einzige, was in den ersten beiden Artikeln fehlt, sind die Nachbearbeitungsschritte, die, um ehrlich zu sein, in der Praxis nicht so oft angewendet werden wie die anderen.
quelle