Ich verstehe, wie Faltung funktioniert, aber ich verstehe nicht, wie 1D-Faltungen auf 2D-Daten angewendet werden.
In diesem Beispiel sehen Sie eine 2D-Faltung in 2D-Daten. Aber wie wäre es, wenn es eine 1D-Faltung wäre? Nur ein 1D-Kernel, der auf die gleiche Weise gleitet? Und wenn der Schritt 2 war?
Vielen Dank!
conv-neural-network
Gustavo
quelle
quelle
Antworten:
Sei eine Folge von Vektoren (z. B. Wortvektoren). Das Anwenden einer Faltungsschicht entspricht dem Anwenden der gleichen Gewichtsmatrizen auf alle n-Gramm, wobei die Höhe Ihres Filters ist. Wenn beispielsweise , können Sie es wie folgt visualisieren:x1, … , X.n n = 3n n = 3
Eine etwas mathematischere Erklärung finden Sie in Ji Young Lee, Franck Dernoncourt. " Sequentielle Kurztextklassifikation mit wiederkehrenden und faltungsbedingten neuronalen Netzen ". NAACL 2016 . Abschnitt 2.1.2:
quelle
1D-Faltungen werden in Faltungsnetzwerken zum Abwärts- und Aufwärtsabtasten in der Filterdimension verwendet. Faltungsnetzwerke bauen diese Filterkarten auf, während Sie durch das Netzwerk gehen. Sie können sie sich wirklich als eine dritte Dimension vorstellen. Der übliche Grundfall für die Filterkartengröße ist eine Größe von 3, da häufig RGB-Bilder durch unser Netzwerk geleitet werden.
Diese 1D-Faltungen können nützlich sein, um eine Abtastung durchzuführen, eine Operation auszuführen und dann eine Abtastung auf dieselbe Dimension vorzunehmen. Dies ist aus Leistungsgründen sehr nützlich.
Um wirklich intuitiv zu verstehen, würde ich empfehlen zu lesen:
Netzwerk im Netzwerk - http://arxiv.org/abs/1312.4400
Mit Faltungen tiefer gehen - https://www.google.com/url?sa=t&source=web&rct=j&url=http://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf&ved=0ahUKEwi89oeuxqnLAhXhuIMKHGGGGGGGGGGGGGGGG rrECNQ72wI3PH1Qw & sig2 = VhjfaMvuskNIDVKhFfNiqQ
quelle