Messen der Objektgröße mithilfe eines tiefen neuronalen Netzwerks

10

Ich habe einen großen Datensatz von Fahrzeugen mit der Grundwahrheit ihrer Länge (über 100.000 Proben). Ist es möglich, ein tiefes Netzwerk zu trainieren, um die Fahrzeuglänge zu messen / zu schätzen? Ich habe keine Artikel über die Schätzung der Objektgröße mithilfe eines tiefen neuronalen Netzwerks gesehen.

Naji
quelle
1
Sehr gute Frage. Willkommen bei AI!
DukeZhou
(Hinweis für den Moderator) - Dies ist eine Platzhalterantwort, um OP eine Frage zu stellen, da ich keinen Kommentar abgeben kann. Sind Ihre Datenbilder oder Text? hisairnessag3 ist auf dem richtigen Weg mit der Portierung des Pixel / Metrik-Ansatzes von OpenCV auf eine Objekterkennung DNN
Adnan S

Antworten:

4

Ja! Dies kann mit Sicherheit getan werden. Da Sie einen beschrifteten Datensatz haben, ist dies umso einfacher!

Ich würde mir dieses Projekt ansehen und das sollte dich dahin bringen, wo du hin musst.

Die Implementierungsdetails sollten ziemlich einfach sein. Lassen Sie mich wissen, ob ich Ihnen weiterhelfen kann.

hisairnessag3
quelle
1
Es ist nicht notwendig zu erklären, warum jemand nicht abstimmt. Viele Programmierer haben nicht genug Zeit, um sich die Kommentare anzusehen. Sie schauen sich die Stimmen an, um zu sehen, ob sich die Antwort lohnt oder nicht. Wenn Sie die Frage erneut lesen, werden Sie feststellen, dass es bei der Frage speziell um die Verwendung von DNN geht und nicht um etwas anderes. In dem von Ihnen freigegebenen Projekt geht es um die Verwendung von Opencv. Wenn Sie die Kommentare unter dem von Ihnen freigegebenen Beitrag lesen, werden Sie feststellen, dass Leute nach DNN fragen, aber der Beitrag selbst verwendet DNN nicht. Übrigens bin ich nicht die Person, die Ihre Antwort
abgelehnt hat
2
Es ist nicht notwendig, aber hilfreich. Wenn Sie in einer beliebigen Tiefe suchen, finden Sie keine Projekte oder Dokumente zu diesem speziellen Anwendungsfall für DNNs. Nachdem dies gesagt wurde, verwies ich auf das nächstmögliche Projekt in der Hoffnung, OP in Betrieb zu nehmen. Zusätzlich habe ich die Frage beantwortet. Die Frage war, ob dies möglich ist.
hisairnessag3
Danke für deine Antwort! Ich denke, es würde durch eine kleine Erklärung verbessert, wie / warum es möglich ist. Zumindest ein Überblick über die Architektur wäre sehr hilfreich.
Ben N
1

Ja, es ist möglich, aber zuerst müssen Sie ein Objekt im Bild erkennen, entweder 1) das Fahrzeug selbst und dann die bekannte Größe des Fahrzeugs oder 2) ein bekanntes Objekt, das den gleichen Abstand von der Kamera wie das Auto hat ( eine Bordsteinkante, ein Stoppschild, den Kopf des Fahrers, ein Shetlandpony ... was auch immer), und verwenden Sie dann dieses Objekt, um die Größe des Autos zu kalibrieren, das sehr nahe daran ist.

Jedes Auto in einem Bild befindet sich in unbekannter Entfernung von der Kamera, sodass das Autoobjekt von Foto zu Foto größer oder kleiner erscheint. Wenn Sie das Auto oder zumindest ein Referenzobjekt mit einer bekannten Größe nicht erkennen, wird die physische Größe des Autos nicht kalibriert - Sie haben keine Grundlage für Ihre Größenschätzung.

Wenn das Auto unbekannt ist, kann das unbekannte Ausmaß des Weitwinkels des Kameraobjektivs die Form eines unbekannten Autos verzerren, selbst wenn Sie visuelle Hinweise haben (es ist ein Referenzobjekt vorhanden oder die Entfernung von Kamera zu Auto ist bekannt) (Höhe gegen Breite), was Ihre Fähigkeit, die scheinbaren Abmessungen abzuschätzen, weiter erschwert.

Geil
quelle
Kann das Nummernschild des Fahrzeugs das bekannte Objekt sein, mit dem die Größe des Fahrzeugs kalibriert wird? Nummernschilder haben normalerweise die gleiche Größe.
Naji
1
Sie müssen vorsichtig sein, wenn Sie davon ausgehen, dass die Nummernschilder dieselbe Größe haben. Beispielsweise haben eine australische Platte und eine US-Platte unterschiedliche Größen. Wenn dies für Ihre Anwendung kein Problem darstellt (sie wird immer nur in einem Land ausgeführt), können Sie eine Referenzgröße für die Platte annehmen. Sie müssten trotzdem vorsichtig sein, da die Platte möglicherweise nicht normal zu Ihnen ausgerichtet ist. Wenn sich das Auto in einem Winkel von 45 Grad befindet, nimmt die Breite der Platte auch bei gleichem Abstand weniger Pixel als bei 0 ein.
Pshlady
1

Ich denke, dieses Papier kann Ihnen helfen: 3D-Bounding-Box-Schätzung mit Deep Learning und Geometrie

Er benutzte 1 VGG-19 (auf ImageNet vorgeschult), um die Größe von Autos zu lernen

cryax dsa
quelle
Wie Sie habe ich angenommen, dass es darum geht, einen 3D-Begrenzungsrahmen abzuleiten, in dem die Daten in einem 2D-Bild dargestellt werden. Das von hisairnessag3 erwähnte Projekt scheint nur den 2D-Begrenzungsrahmen ohne erlerntes Inferenzverhalten über die 3D-Natur, die das Bild enthalten könnte, anzusprechen.
Jim
In diesem Artikel wird die Größe und Ausrichtung des Fahrzeugs anhand eines zugeschnittenen 2D-Bildes geschätzt (enthält nur das gewünschte Objekt).
Cryax dsa