Was sind Engpassmerkmale?

11

In dem Blog-Beitrag Erstellen leistungsfähiger Bildklassifizierungsmodelle mit sehr wenigen Daten werden Engpassfunktionen erwähnt. Was sind die Engpassmerkmale? Ändern sie sich mit der verwendeten Architektur? Sind sie die endgültige Ausgabe von Faltungsschichten vor der vollständig verbundenen Schicht? Warum heißen sie so?

Abhishek Bhatia
quelle
[Siehe auch dies] ( ai.stackexchange.com/questions/4864/… )
Anurag Singh

Antworten:

9

In dem Blog-Beitrag Erstellen leistungsfähiger Bildklassifizierungsmodelle mit sehr wenigen Daten werden Engpassfunktionen erwähnt. Was sind die Engpassmerkmale?

Es ist deutlich in dem Link geschrieben, den Sie den "Engpassfunktionen" des VGG16-Modells gegeben haben: Die letzten Aktivierungskarten vor den vollständig verbundenen Ebenen .

Ändern sie sich mit der verwendeten Architektur?

Sicher. Der Autor verwendete höchstwahrscheinlich ein vorab trainiertes Modell (das auf großen Datenmengen trainiert wurde und jetzt nur noch als Feature-Extraktor verwendet wird).

Sind sie die endgültige Ausgabe von Faltungsschichten vor der vollständig verbundenen Schicht?

Ja.

Warum heißen sie so?

Angesichts der Eingabegröße für VGG werden die Feature-Maps mit HxW-Abmessungen nach jeder Max-Pool-Operation zweimal kleiner. HxB ist das kleinste auf der letzten Faltungsschicht.

FunkyKowal
quelle
6

Zunächst müssen wir über Transferlernen sprechen. Stellen Sie sich vor, Sie haben ein neuronales Netzwerk über einen Datensatz von Bildern trainiert, um Katzen zu erkennen. Sie können einen Teil des Trainings verwenden, das Sie durchgeführt haben, um über ein anderes zu arbeiten, um etwas anderes zu erkennen. Das ist als Transferlernen bekannt.

Um das Transferlernen durchzuführen, entfernen Sie die letzte vollständig verbundene Ebene aus dem Modell und schließen dort Ihre Ebenen an. Die "abgeschnittene" Modellausgabe wird die Funktionen sein, die Ihr "Modell" füllen. Das sind die Engpassmerkmale.

VGG16 ist ein Pretrain-Modell über den ImageNet-Katalog, das eine sehr gute Genauigkeit aufweist. In dem Beitrag, den Sie geteilt haben, wird dieses Modell als Basis verwendet, um Katzen und Hunde mit einer höheren Genauigkeit zu erkennen.

Die Engpassfunktionen hängen vom Modell ab. In diesem Fall verwenden wir VGG16. Es gibt andere vorgefertigte Modelle wie VGG19, ResNet-50

Es ist, als würden Sie ein Modell schneiden und Ihre eigenen Ebenen hinzufügen. Hauptsächlich die Ausgabeebene, um zu entscheiden, was Sie erkennen möchten, die endgültige Ausgabe.

letyrodri
quelle