In der Arbeit Photo-Realistic Single Image Super-Resolution unter Verwendung eines generativen kontradiktorischen Netzwerks von Christian Ledig et al. Wird der Abstand zwischen Bildern (in der Verlustfunktion verwendet) aus Feature-Maps berechnet, die aus dem VGG19-Netzwerk extrahiert wurden. Die beiden im Artikel verwendeten werden (etwas verwirrend) VGG22 und VGG54 genannt.
Was sind diese Feature-Maps?
Was bedeuten die Bezeichnungen "22" und "54"?
deep-learning
cnn
gan
Lafayette
quelle
quelle
Antworten:
Beim Lesen des Artikels scheint es, als würden sie VGG54 als den Verlust definieren, der aus dem euklidischen Abstand zwischen den -Feature-Maps berechnet wird, die sowohl aus Bildern mit hoher als auch mit niedriger Auflösung unter Verwendung des VGG19-Netzwerks abgeleitet wurden. Wobei definiert ist als " die Merkmalskarte, die durch die j-te Faltung (nach Aktivierung) und vor der i-ten Max-Pooling-Schicht innerhalb des VGG19-Netzwerks erhalten wird ".ϕ5 , 4 ϕich , j
quelle