Welche Bedeutung hat die Anzahl der Faltungsfilter in einem Faltungsnetzwerk?

16

Was bedeutet die Anzahl der Filter in einer Faltungsschicht?
Wie wirkt sich diese Zahl auf die Leistung oder Qualität der Architektur aus? Ich meine, sollten wir uns immer für eine höhere Anzahl von Filtern entscheiden? was ist gut von ihnen? und Wie ordnet man unterschiedliche Anzahl von Filtern für verschiedene Ebenen zu? Ich meine mit Blick auf diese Frage: Wie kann man die Anzahl der Faltungsoperatoren in CNN bestimmen?
Die Antwort spezifizierte 3 Faltungsschicht mit unterschiedlicher Anzahl von Filtern und Größe. Wieder in dieser Frage: Anzahl von Merkmalskarten in Faltungsneuralnetzen Sie können aus dem Bild ersehen, dass wir 28 * 28 * 6 Filter für die erste Schicht und 10 * 10 * 16 Filter für die zweite Konv. Schicht haben. Wie kommen sie auf diese Zahlen? Ist das durch Versuch und Irrtum? Danke im Voraus

Rika
quelle

Antworten:

8

Was bedeutet die Anzahl der Filter in einer Faltungsschicht? - Ich stelle mir Filter normalerweise gerne als Feature-Detektoren vor. Obwohl dies von der Problemdomäne abhängt, ist die Bedeutung der Feature-Detektoren intuitiv die Anzahl der Features (wie Kanten, Linien, Objektteile usw.), die das Netzwerk möglicherweise lernen kann. Beachten Sie außerdem, dass jeder Filter eine Feature-Map generiert. Mithilfe von Feature-Maps können Sie die erklärenden Faktoren im Bild lernen. Je mehr # -Filter dies bedeutet, desto mehr lernt das Netzwerk (nicht unbedingt immer gut - Sättigung und Konvergenz sind am wichtigsten).

Wie wirkt sich diese Zahl auf die Leistung oder Qualität der Architektur aus? - Ich glaube nicht, dass Sie eine gute Antwort auf diese Art von Fragen finden werden, da wir immer noch versuchen zu formalisieren, was in der DL-Blackbox vor sich geht. Noch einmal intuitiv lernen Sie eine robustere nichtlineare Funktion, je mehr Filterbänke Sie haben, aber die Leistung wird von der Art der Aufgabe und den Dateneigenschaften abhängen. In der Regel möchten Sie wissen, mit welchen Daten Sie arbeiten, um die # Parameter in Ihrer Architektur (einschließlich Filter) zu bestimmen. Wie viele Filter brauche ich? Es ist eher so, als würde man fragen, wie komplex (speziell) die Bilder in meinem Datensatz sind. Es gibt keine formale Vorstellung, die # Filter mit Leistung in Verbindung bringt. Es ist alles experimentell und iterativ. Viel Trail und Irrtum sind sicher.

Henok G.
quelle
Gute Antwort, ergänzt um die obigen Punkte: CNNs sind jedoch keine Blackboxen mehr. Sie können die von Feature-Maps erlernten Features tatsächlich anzeigen. Die Anzahl der Filter, die Sie in einer Ebene festlegen, soll es ENOUGH-Containern ermöglichen, im Netzwerk relevante Funktionen (oder deren Kombinationen) kennenzulernen. Was die ausreichende Anzahl ist -> hängt vom Datensatz ab. Angenommen, ein CNN-Netzwerk auf Schicht X benötigt mindestens 24 Feature-Maps, um wichtige Features zu erlernen. Sie geben also beispielsweise 32 an und arbeiten an der Idee, dass Sie dem Netzwerk eine Atempause geben und es für sich entscheiden lassen, vielleicht einige von 32 sind überflüssig oder leicht variiert.
MANU