Was bedeutet die Anzahl der Filter in einer Faltungsschicht?
Wie wirkt sich diese Zahl auf die Leistung oder Qualität der Architektur aus? Ich meine, sollten wir uns immer für eine höhere Anzahl von Filtern entscheiden? was ist gut von ihnen? und Wie ordnet man unterschiedliche Anzahl von Filtern für verschiedene Ebenen zu? Ich meine mit Blick auf diese Frage: Wie kann man die Anzahl der Faltungsoperatoren in CNN bestimmen?
Die Antwort spezifizierte 3 Faltungsschicht mit unterschiedlicher Anzahl von Filtern und Größe. Wieder in dieser Frage: Anzahl von Merkmalskarten in Faltungsneuralnetzen
Sie können aus dem Bild ersehen, dass wir 28 * 28 * 6 Filter für die erste Schicht und 10 * 10 * 16 Filter für die zweite Konv. Schicht haben. Wie kommen sie auf diese Zahlen? Ist das durch Versuch und Irrtum? Danke im Voraus
16
Antworten:
Was bedeutet die Anzahl der Filter in einer Faltungsschicht? - Ich stelle mir Filter normalerweise gerne als Feature-Detektoren vor. Obwohl dies von der Problemdomäne abhängt, ist die Bedeutung der Feature-Detektoren intuitiv die Anzahl der Features (wie Kanten, Linien, Objektteile usw.), die das Netzwerk möglicherweise lernen kann. Beachten Sie außerdem, dass jeder Filter eine Feature-Map generiert. Mithilfe von Feature-Maps können Sie die erklärenden Faktoren im Bild lernen. Je mehr # -Filter dies bedeutet, desto mehr lernt das Netzwerk (nicht unbedingt immer gut - Sättigung und Konvergenz sind am wichtigsten).
Wie wirkt sich diese Zahl auf die Leistung oder Qualität der Architektur aus? - Ich glaube nicht, dass Sie eine gute Antwort auf diese Art von Fragen finden werden, da wir immer noch versuchen zu formalisieren, was in der DL-Blackbox vor sich geht. Noch einmal intuitiv lernen Sie eine robustere nichtlineare Funktion, je mehr Filterbänke Sie haben, aber die Leistung wird von der Art der Aufgabe und den Dateneigenschaften abhängen. In der Regel möchten Sie wissen, mit welchen Daten Sie arbeiten, um die # Parameter in Ihrer Architektur (einschließlich Filter) zu bestimmen. Wie viele Filter brauche ich? Es ist eher so, als würde man fragen, wie komplex (speziell) die Bilder in meinem Datensatz sind. Es gibt keine formale Vorstellung, die # Filter mit Leistung in Verbindung bringt. Es ist alles experimentell und iterativ. Viel Trail und Irrtum sind sicher.
quelle