Ich weiß, dass HOG für die Personenerkennung ziemlich auf dem neuesten Stand der Technik ist, aber in seiner ursprünglichen Form ist HOG nur eine Erkennungsmethode, und ich glaube auch nicht, dass es besonders schnell ist (es gibt eine signifikante Beschleunigung, die das Schiebefenster nimmt und zurückweist unwahrscheinliche Möglichkeiten früh, aber es wurde patentiert).
Was ist der aktuelle Ansatz nach dem Stand der Technik, um die Pose einer Person zu bestimmen (einschließlich enger Posen wie Kopf- und Handschuss usw.) und um die Person vom Hintergrund zu segmentieren?
Die Einstellung hier ist Standbilder.
computer-vision
image-segmentation
face-detection
John Robertson
quelle
quelle
Antworten:
Schauen Sie sich die Arbeit von Yang und Ramanan mit einer flexiblen Mischung von Teilen an. Es beginnt mit einem zentralen Teil, aber angehängte Teilepaare werden gemeinsam erkannt, indem die Wahrscheinlichkeit geschätzt wird, dass der abgefragte Bildbereich das gleichzeitige Auftreten der angehängten Teile im Bild unterstützt. Ein Fehler im Anbaugerät wird vermutet und mit einem federartigen Modell minimiert. Jeder Teil wird mithilfe von HOG-Techniken erkannt, und alle Teilepaare im menschlichen "Baum" werden wiederholt, um die Erkennung zu bestimmen. Nach meiner Erfahrung hat es eine sehr gute Fehlalarmrate, erfordert jedoch Hardwarebeschleunigung für Echtzeitanwendungen.
quelle