Was ist der Unterschied zwischen Conv-Schichten und FC-Schichten ?
Warum kann ich keine Conv-Ebenen anstelle von FC-Ebenen verwenden ?
Was ist der Unterschied zwischen Conv-Schichten und FC-Schichten ?
Warum kann ich keine Conv-Ebenen anstelle von FC-Ebenen verwenden ?
Eine Faltungsschicht wendet denselben (normalerweise kleinen) Filter wiederholt an verschiedenen Positionen in der darunter liegenden Schicht an. Wenn die Eingabeebene beispielsweise die Abmessungen 512 x 512 hat, können Sie eine Conv-Ebene verwenden, die an jedem Punkt in (z. B.) einem 128 x 128-Raster, das der Eingabeebene überlagert ist, denselben 8 x 8-Filter (angegeben durch 64 Filterkoeffizienten) anwendet . Andererseits würde jeder Knoten in einer vollständig verbundenen Schicht 512 x 512 Gewichte lernen, eine für jeden der Knoten in der Eingabeebene.
Conv-Ebenen eignen sich daher gut zum Erkennen lokaler Merkmale, die an einer beliebigen Stelle in der Eingabe auftreten können (z. B. Kanten in einem visuellen Bild). Die Idee ist, dass Sie nicht jeden Knoten einzeln trainieren müssen, um dieselbe Funktion zu erkennen, sondern einen Filter lernen, der von allen Knoten gemeinsam genutzt wird.
(Beachten Sie, dass jede Conv-Ebene normalerweise eine Reihe von mehreren Filtern lernt, von denen jeder wiederholt auf die Eingabe angewendet wird. Wenn die Conv-Ebene beispielsweise 16 verschiedene Merkmale lernt, hat sie eine "Tiefe" von 16.)
FC-Schichten werden verwendet, um bestimmte globale Konfigurationen der Merkmale zu erkennen, die von den unteren Schichten im Netz erkannt werden. Sie befinden sich normalerweise an der Spitze der Netzwerkhierarchie, zu einem Zeitpunkt, an dem die Eingabe (durch die vorherigen, normalerweise Faltungsschichten) auf eine kompakte Darstellung von Merkmalen reduziert wurde. Jeder Knoten in der FC-Schicht lernt seine eigenen Gewichte für alle Knoten in der darunter liegenden Schicht.
Sie können sich Conv-Layer also (grob) als Aufteilung der Eingabe (z. B. eines Bildes) in gemeinsame Features vorstellen, und die FC-Layer als Zusammenfügen dieser Features zu z. B. Objekten, die das Netzwerk erkennen soll.
Sie können Conv-Ebenen für anstelle von FC verwenden. Aufgrund der Art der Conv-Schichten, in denen Gewichte geteilt werden, gibt es jedoch viel weniger Parameter. Dies kann dazu führen, dass Ihr Netzwerk möglicherweise nicht in der Lage ist, das Zeug zu lernen. Aber alles hängt von Ihrem Netzwerk ab.
quelle