Datenerweiterung bei Verwendung von flow_from_directory in CNN

7

Ich möchte einen kleinen Datensatz verwenden, um ein CNN-Modell zu erstellen. Daher verwende ich die Datenerweiterung, um den Zugdatensatz zu vergrößern. Soll ich alle Augmentationstechniken (Argumente) verwenden , die aufgeführt hier ?

Ich habe festgestellt, dass das Hinzufügen vieler Argumente die Genauigkeit des Modells verringert und das Trainingsset schwieriger macht als das Testset.

Was sind die Best Practices für die Verwendung der Datenerweiterung bei der Verwendung flow_from_directory?

Noran
quelle

Antworten:

6

Augmentationen hängen oft von der Art Ihrer Daten ab. Stellen Sie sich vor, das Ergebnis einer Erweiterung wäre in Ihrem Kontext logisch.

Angenommen, Sie haben einen Datensatz "Katzen gegen Hunde". Die Bilder hier können von links nach rechts gespiegelt werden. Andererseits macht es im MNIST-Datensatz keinen Sinn, die Bilder überhaupt umzudrehen (was nützt es, wenn Sie Ihrem Modell eine umgedrehte '3' zuführen). Einige Erweiterungen könnten das Modell tatsächlich verwirren (z. B. könnte eine umgedrehte '9' wie eine '6' aussehen).

[5

ILM91
quelle