Was bedeutet eine Engpassschicht in neuronalen Netzen?

14

Ich habe das FaceNet- Papier gelesen und im dritten Absatz der Einleitung heißt es:

Frühere Gesichtserkennungsansätze, die auf tiefen Netzwerken basieren, verwenden eine Klassifizierungsschicht, die über einen Satz bekannter Gesichtsidentitäten trainiert wurde, und verwenden dann eine Zwischenengpassschicht als Darstellung, um die Erkennung über den im Training verwendeten Satz von Identitäten hinaus zu verallgemeinern.

Ich habe mich gefragt, was sie unter einer Zwischenengpassschicht verstehen.

YellowPillow
quelle
1
Es wird verwendet, um die Anzahl der Berechnungen zu reduzieren und eine Transformation der vorherigen Ebene durchzuführen.
kxm Stille

Antworten:

16

Eine Engpassschicht ist eine Schicht, die im Vergleich zu den vorherigen Schichten nur wenige Knoten enthält. Es kann verwendet werden, um eine Darstellung der Eingabe mit reduzierter Dimensionalität zu erhalten. Ein Beispiel hierfür ist die Verwendung von Autoencodern mit Engpassschichten zur Reduzierung der nichtlinearen Dimensionalität.

Mein Verständnis des Zitats ist, dass frühere Ansätze ein tiefes Netzwerk verwenden, um Gesichter zu klassifizieren. Sie nehmen dann die ersten Schichten dieses Netzwerks von der Eingabe bis zu einer Zwischenschicht (z. B. der ten Schicht, die Knoten enthält). Dieses Subnetz implementiert eine Zuordnung vom Eingaberaum zu einem dimensionalen Vektorraum. Die te Schicht ist eine Engpassschicht, daher ergibt der Aktivierungsvektor von Knoten in der ten Schicht eine niedrigdimensionale Darstellung der Eingabe. Das ursprüngliche Netzwerk kann nicht zum Klassifizieren neuer Identitäten verwendet werden, für die es nicht trainiert wurde. Aber dieknknkkkkDie Schicht kann im Allgemeinen eine gute Darstellung von Gesichtern liefern. Um neue Identitäten zu lernen, können neue Klassifiziererebenen auf die te Ebene gestapelt und trainiert werden. Oder die neuen Trainingsdaten können durch das Teilnetzwerk eingespeist werden, um Darstellungen von der ten Schicht zu erhalten, und diese Darstellungen können einem anderen Klassifizierer zugeführt werden.kk

user20160
quelle