Ich habe einen großen Datensatz von Fahrzeugen mit der Grundwahrheit ihrer Länge (über 100.000 Proben). Ist es möglich, ein tiefes Netzwerk zu trainieren, um die Fahrzeuglänge zu messen / zu schätzen? Ich habe keine Artikel über die Schätzung der Objektgröße mithilfe eines tiefen neuronalen Netzwerks gesehen.
10
Antworten:
Ja! Dies kann mit Sicherheit getan werden. Da Sie einen beschrifteten Datensatz haben, ist dies umso einfacher!
Ich würde mir dieses Projekt ansehen und das sollte dich dahin bringen, wo du hin musst.
Die Implementierungsdetails sollten ziemlich einfach sein. Lassen Sie mich wissen, ob ich Ihnen weiterhelfen kann.
quelle
Ja, es ist möglich, aber zuerst müssen Sie ein Objekt im Bild erkennen, entweder 1) das Fahrzeug selbst und dann die bekannte Größe des Fahrzeugs oder 2) ein bekanntes Objekt, das den gleichen Abstand von der Kamera wie das Auto hat ( eine Bordsteinkante, ein Stoppschild, den Kopf des Fahrers, ein Shetlandpony ... was auch immer), und verwenden Sie dann dieses Objekt, um die Größe des Autos zu kalibrieren, das sehr nahe daran ist.
Jedes Auto in einem Bild befindet sich in unbekannter Entfernung von der Kamera, sodass das Autoobjekt von Foto zu Foto größer oder kleiner erscheint. Wenn Sie das Auto oder zumindest ein Referenzobjekt mit einer bekannten Größe nicht erkennen, wird die physische Größe des Autos nicht kalibriert - Sie haben keine Grundlage für Ihre Größenschätzung.
Wenn das Auto unbekannt ist, kann das unbekannte Ausmaß des Weitwinkels des Kameraobjektivs die Form eines unbekannten Autos verzerren, selbst wenn Sie visuelle Hinweise haben (es ist ein Referenzobjekt vorhanden oder die Entfernung von Kamera zu Auto ist bekannt) (Höhe gegen Breite), was Ihre Fähigkeit, die scheinbaren Abmessungen abzuschätzen, weiter erschwert.
quelle
Ich denke, dieses Papier kann Ihnen helfen: 3D-Bounding-Box-Schätzung mit Deep Learning und Geometrie
Er benutzte 1 VGG-19 (auf ImageNet vorgeschult), um die Größe von Autos zu lernen
quelle