Ich habe eine Frage zur Objekterkennung, insbesondere zur Erkennung von Automodellen! Ich bin am Anfang einer Arbeit über die Identifizierung des gleichen Automodells in verschiedenen Bildern. Im Moment denke ich, dass einer der besten Algorithmen für die 3D-Objekterkennung SIFT ist, aber nachdem ich ein bisschen mit einer Demo-Implementierung herumgespielt habe, habe ich das seltsame Gefühl, dass dieser Algorithmus einige Probleme mit glänzenden Metallobjekten wie Autos hat, insbesondere wenn sie unterschiedliche Farben haben.
Kennt jemand einige Arbeiten in diesem Bereich im Allgemeinen einen geeigneten Algorithmus für die Aufgabe, dasselbe Automodell in verschiedenen Bildern zu finden?
Vielen Dank im Voraus für Ihre Hilfe!
Antworten:
Ich würde mir den sogenannten "Bag of Words" - oder "Visual Words" -Ansatz ansehen. Es wird zunehmend zur Kategorisierung und Identifizierung von Bildern verwendet. Dieser Algorithmus beginnt normalerweise mit der Erkennung robuster Punkte, wie z. B. SIFT-Punkte, in einem Bild. Der Bereich um diese gefundenen Punkte (in Ihrem Fall der 128-Bit-SIFT-Deskriptor) wird verwendet.
In der einfachsten Form kann man alle Daten aus allen Deskriptoren aller Bilder sammeln und gruppieren, beispielsweise mit k-means. Jedes Originalbild hat dann Deskriptoren, die zu einer Reihe von Clustern beitragen. Die Schwerpunkte dieser Cluster, dh die visuellen Wörter, können als neuer Deskriptor für das Bild verwendet werden. Grundsätzlich hoffen Sie, dass die Cluster eines Bildes, zu dem seine Deskriptoren beitragen, auf die Bildkategorie hinweisen.
Wiederum haben Sie im einfachsten Fall eine Liste von Clustern und pro Bild zählen Sie, welcher dieser Cluster Deskriptoren aus diesem Bild enthielt und wie viele. Dies ähnelt der TD / IFD-Methode (Term Frequency / Inverse Document Frequency), die beim Abrufen von Text verwendet wird. Sehen Sie sich dieses schnelle und schmutzige Matlab- Skript an.
Dieser Ansatz wird aktiv erforscht und es gibt viele viel fortgeschrittenere Algorithmen.
Die VLfeat-Website enthält eine ausführlichere Demo dieses Ansatzes, in der der Caltech 101-Datensatz klassifiziert wird. Bemerkenswert sind auch Ergebnisse und Software von Caltech .
quelle