Ich möchte mein trainiertes Modell an einem unausgeglichenen Datensatz testen lassen. Gibt es Algorithmen, um synthetische Daten aus einem ausgewogenen, beschrifteten Datensatz (Spam / Nicht-Spam) zu generieren?
unbalanced-classes
synthetic-data
Stuart Peterson
quelle
quelle
Antworten:
Probieren Sie SMOTE aus , einen Algorithmus, der für die Überabtastung verwendet wird. Es werden synthetische Samples aus der Klasse erstellt, die überabgetastet werden soll.
Sie können dies verwenden, um eine beliebige Anzahl von Proben zu erstellen, die Sie benötigen.
quelle