Ich arbeite seit einiger Zeit an einem Projekt, um Fahrzeuge in Videos zu erkennen und zu verfolgen, die von UAVs aufgenommen wurden. Derzeit verwende ich eine SVM, die auf der Darstellung von Merkmalen lokaler Merkmale trainiert ist, die aus Fahrzeug- und Hintergrundbildern extrahiert wurden. Ich verwende dann einen Schiebefenster-Erkennungsansatz, um zu versuchen, Fahrzeuge in den Bildern zu lokalisieren, die ich dann verfolgen möchte. Das Problem ist, dass dieser Ansatz viel zu langsam ist und mein Detektor nicht so zuverlässig ist, wie ich es gerne hätte. Ich bekomme also einige Fehlalarme.
Ich habe überlegt, die Autos aus dem Hintergrund zu segmentieren, um die ungefähre Position zu finden, um den Suchraum zu verringern, bevor ich meinen Klassifikator anwende. Ich bin mir jedoch nicht sicher, wie ich vorgehen soll, und hatte gehofft, jemand könnte helfen?
Außerdem habe ich über Bewegungssegmentierung mit Ebenen gelesen und den optischen Fluss verwendet, um das Bild nach Flussmodell zu segmentieren. Hat jemand Erfahrung mit dieser Methode? Wenn ja, könnten Sie einen Beitrag dazu leisten, ob diese Methode Ihrer Meinung nach anwendbar wäre mein Problem.
UPDATE : Ich habe diese Frage auch zum Stapelüberlauf gestellt und hatte eine ausgezeichnete Antwort . Ich habe diese Idee bereits umgesetzt und sie funktioniert überraschend gut. Ich untersuche jetzt die Verwendung des optischen Flusses zusätzlich zu dieser Technik.
Unten sehen Sie zwei Bilder aus einem Beispielvideo
quelle