Kann ein einzelnes neuronales Netzwerk zwei Arten von Objekten erkennen oder sollte es in zwei kleinere Netzwerke aufgeteilt werden?

9

Insbesondere analysiert ein eingebetteter Computer (mit begrenzten Ressourcen) den Live-Videostream einer Verkehrskamera und versucht, gute Frames auszuwählen, die Kennzeichen vorbeifahrender Autos enthalten. Sobald eine Platte gefunden wurde, wird der Rahmen an eine OCR-Bibliothek übergeben, um die Registrierung zu extrahieren und weiter zu verwenden.

In meinem Land werden üblicherweise zwei Arten von Nummernschildern verwendet - rechteckig (typisch) und quadratisch - tatsächlich etwas rechteckig, aber "höher als breiter", wobei die Registrierung auf zwei Zeilen aufgeteilt ist.

(Es gibt noch einige andere Typen, aber lassen Sie uns sie ignorieren. Sie machen nur einen kleinen Prozentsatz aus und gehören normalerweise zu Fahrzeugen, die außerhalb unseres Interesses liegen.)

Aufgrund der begrenzten Ressourcen und des Bedarfs an schneller Echtzeitverarbeitung ist die maximale Größe des Netzwerks (Anzahl der Zellen und Verbindungen), die das System verarbeiten kann, festgelegt.

Wäre es besser, dies in zwei kleinere Netzwerke aufzuteilen, die jeweils einen Typ von Kennzeichen erkennen, oder wird das größere einzelne Netzwerk die beiden Typen besser handhaben?

SF.
quelle

Antworten:

6

Nun, ich weiß nicht, welche Art von Funktionen Sie Ihrem neuronalen Netzwerk geben. Im Allgemeinen würde ich jedoch mit einem einzigen neuronalen Netzwerk arbeiten. Es scheint, dass Sie keine Ressourcenbeschränkungen für das Training Ihres Netzwerks haben und das einzige Problem sind Ressourcen, während Sie Ihr Netzwerk anwenden.

Die Sache ist, dass wahrscheinlich die beiden Probleme Gemeinsamkeiten haben (z. B. sind beide Plattentypen rechteckig). Dies bedeutet, dass bei Verwendung von zwei Netzwerken jedes das gleiche Unterproblem (den gemeinsamen Teil) erneut lösen muss. Wenn Sie nur ein Netzwerk verwenden, müssen für den gemeinsamen Teil des Problems weniger Zellen / Gewichte gelöst werden, und die verbleibenden Gewichte / Zellen können zur besseren Erkennung verwendet werden.

Wenn ich an Ihrer Stelle wäre, würde ich am Ende beide ausprobieren. Ich denke, das ist der einzige Weg, um wirklich sicher zu sein, was die beste Lösung ist. Wenn wir theoretisch sprechen, ist es möglich, dass wir einige Faktoren nicht berücksichtigen.

Didam ich
quelle