Computer Vision Algorithmen (wie ist das möglich?)

9

Ich bin kürzlich auf ein Unternehmen gestoßen, das eine scheinbar Computer-Vision-Technologie entwickelt hat, die Ladendiebstahl automatisch erkennt und seine Benutzer alarmiert.

VERKNÜPFUNG

Das Anschauen einiger Videos und Beispiele des Unternehmens hat mich völlig verblüfft und erstaunt darüber, wie um alles in der Welt sie diese Funktionalität erreicht haben könnten.

Ich verstehe, dass niemand hier in der Lage sein wird, mir genau zu sagen, wie dies erreicht worden sein könnte, aber jemand ist sich der Forschung auf diesem Gebiet bewusst - und könnte mich darauf hinweisen - oder alternativ vielleicht Details darüber liefern, wie so etwas implementiert werden könnte oder Anleitung, wo man anfangen könnte?

Mein Verständnis war, dass die Computer-Vision-Algorithmen viele Jahre davon entfernt waren, so hoch entwickelt zu sein. Ist diese Art der Anwendung wirklich möglich? Jemand, der bereit ist, eine Vermutung anzustellen, wie er dies erreicht hat?

Maxim Gershkovich
quelle
2
Das scheint nicht so schwierig zu sein. Spiele erkennen ständig Kollisionen zwischen Objekten. Warum konnten Sie keine Kollisionen zwischen einer Person und einem Regal mit Gegenständen erkennen und dann einen Alarm auslösen, wenn diese Person zur Tür ging, ohne zu bezahlen?
Robert Harvey
Genau. Es ist nur Objekterkennung und Kollisionserkennung. Wenn sie es nicht an den Scanner anschließen, kann es leicht überwunden werden, indem die Objekte über den Scanner bewegt werden, jedoch nur geringfügig darüber. Das Objekt scheint mit dem Scanner kollidiert zu sein, hat dies aber tatsächlich nicht getan.
Andrew T Finnell
Wie auch immer, keiner der auf der Website beschriebenen Erkennungsmechanismen (Sweethearting, Basket-Loss und Self-Checkout) erfordert etwas, das auch nur aus der Ferne so ausgefeilt ist. Sie checken in einem sehr engen Bereich (dem Kassenschalter) ein und können die im Warenkorb angezeigten Artikel mit dem vergleichen, was der Barcodescanner tatsächlich gescannt hat.
Robert Harvey
1
Es tut mir leid, dass ich verwirrt bin. Nehmen wir das Sweathearting-Beispiel. Ich habe zwei Artikel, einen kostengünstigen und einen hohen Artikel. Ich lege den kostengünstigen Artikel unter den kostenintensiven und scanne. An diesem Punkt können wir vergleichen, was im POS-System gescannt wurde, mit dem, was auf der Kamera in der Hand des Kassierers sichtbar ist, aber das setzt voraus, dass das System in der Lage ist, "zu verstehen, was in die Tasche gesteckt wird", gegen Hunderttausende von Potenzialen Gegenstände durch eine Kamera von marginaler Qualität. Dies scheint äußerst kompliziert zu sein. Was vermisse ich?
Maxim Gershkovich
6
Ich denke, Sie gehen zu sehr davon aus, wie gut das funktioniert. Ich wette, es gibt eine anständige Fehlerrate und es ist wahrscheinlich sehr einfach, das System zu spielen. Ich sehe dies eher als ein Whistleblower-System, bei dem nur potenzielle Stellen im Video identifiziert werden, die einer menschlichen Überprüfung bedürfen. Ungenauigkeiten werden daher gut vertragen.
Chris

Antworten:

5

Sie sind über den Stand der Technik falsch informiert. Vor einigen Jahren arbeitete ich für eine Firma, die solche Systeme für verschiedene Zwecke baute. Eines davon war ein äußerst erfolgreiches Flughafen-Ausstiegskontrollsystem, das leicht den Unterschied zwischen einer Person, die den Ausgangsflur in die falsche Richtung ging, und Dingen wie in Bewegung befindlichen Bällen oder Personen, die in die richtige Richtung gingen, erkennen konnte. Das Erkennen von Objekten in einer Szene in Echtzeit ist nicht einfach, aber wir haben es auf eingebetteten CPUs gemacht, nicht auf Supercomputern.

Ich habe dort nichts gesehen, was vor ein paar Jahren nicht glaubwürdig war.

Ross Patterson
quelle
4

Tatsächlich verwendet dieses Unternehmen in Indien eine Mischung aus Computer Vision und manueller Überprüfung. Es ist keine reine Computer Vision, insbesondere für Elemente wie Schatz. Tatsächlich kenne ich einen Einzelhändler, der ein ziemliches Problem mit diesem System hat, nicht aufgrund der von mir gespeicherten Systemleistung, sondern aufgrund des Bandbreitenversandvideos nach Indien. Diese manuelle Codierung reduziert Fehler und ist eine typische technische Anfrage bei einigen Anbietern.

Mike MacMillan
quelle