Ich habe eine leichte Verwirrung zwischen Objekterkennung und Objekterkennung. Einige Leute sagen, Objekterkennung sei ein Unterthema der Objekterkennung? Kann jemand den Unterschied zwischen diesen beiden Themen klären?
Nach meinem besten Wissen:
Die Objekterkennung beantwortet die Frage "Was ist das Objekt im Bild", während die Objekterkennung die Frage "Wo ist das Objekt?" Beantwortet.
Hoffe, jemand kann den Unterschied veranschaulichen, indem er auch großzügig ein Beispiel für jeden liefert.
image-processing
computer-vision
object-recognition
user2867655
quelle
quelle
Antworten:
Sie haben Ihre eigene Frage beantwortet.
Objekterkennung: Welches Objekt ist im Bild dargestellt?
Eingabe : Ein Bild mit unbekannten Objekten.
Möglicherweise kann die Position des Objekts in der Eingabe markiert werden, oder die Eingabe ist möglicherweise nur ein klares Bild des (nicht verdeckten) Objekts.
Ausgabe : Position (en) und Beschriftung (en) (Namen) der Objekte im Bild
Die Positionen von Objekten werden entweder von der Eingabe erfasst oder basierend auf dem Eingabebild bestimmt.
Beim Beschriften von Objekten gibt es normalerweise eine Reihe von Kategorien / Beschriftungen, die das System "kennt" und zwischen denen das System unterscheiden kann (z. B. Objekt ist entweder Hund, Auto, Pferd, Kuh oder Vogel).
Objekterkennung: Wo befindet sich dieses Objekt im Bild?
Eingabe: ein klares Bild eines Objekts oder eine Art Modell eines Objekts (z. B. Ente) und ein Bild (möglicherweise), das das interessierende Objekt enthält
Ausgabe: Position oder ein Begrenzungsrahmen des Eingabeobjekts, falls es im Bild vorhanden ist (z. B. befindet sich die Ente in der oberen linken Ecke des Bildes)
quelle
Objekterkennungsbasis auf dem interessierenden Punkt eines gegebenen Bildes; Zum Beispiel sprach der Vogel in Bild und Erkennung über die spezifischen Informationen über den Vogel, wie Name, Typ und andere Merkmale von besonderem Interesse.
quelle
spät, aber hier ist die Antwort. Quelle: https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/
Ein Objekterkennungsalgorithmus identifiziert, welche Objekte in einem Bild vorhanden sind. Es nimmt das gesamte Bild als Eingabe und gibt Klassenbeschriftungen und Klassenwahrscheinlichkeiten von Objekten aus, die in diesem Bild vorhanden sind. Beispielsweise könnte ein Klassenlabel "Hund" sein und die zugehörige Klassenwahrscheinlichkeit könnte 97% betragen.
Andererseits sagt Ihnen ein Objekterkennungsalgorithmus nicht nur, welche Objekte im Bild vorhanden sind, sondern gibt auch Begrenzungsrahmen (x, y, Breite, Höhe) aus, um die Position der Objekte im Bild anzuzeigen
quelle