Was ist der Unterschied zwischen "Merkmalen" und "Deskriptoren" in der Bildverarbeitung / im maschinellen Lernen?

7

Ich habe mehrere Zeitsätze ähnlich wie gelesen

Schließlich wurden für die Standardbildklassifizierung Bag-of-Word-Merkmale, die auf SIFT-Deskriptoren basieren, als kritisch für hohe Leistungen befunden. Wir berechnen zunächst einen Standard-SIFT-Diskriptor an regelmäßigen Rasterpunkten über das gesamte Bild.

Quelle: "Mehrklassen-Bildsegmentierung unter Verwendung bedingter Zufallsfelder und globaler Klassifizierung" von Nils Plath, Marc Toussaint, Shinichi Nakajima.

Was ist ein Deskriptor? Ich dachte, SIFT ist ein Algorithmus, der Bilder bearbeitet und Merkmale angibt (Vektoren in , wobei für eine feste Größe von Bildern und Parametern des SIFT-Algorithmus festgelegt ist).R.nn

Martin Thoma
quelle

Antworten:

2

Der SIFT-Deskriptorvektor ist ein Merkmalsvektor. "Deskriptorvektor" und "Merkmalsvektor" sind in diesem Zusammenhang Synonyme. Die meisten Beschreibungen von SIFT, die ich gesehen habe, verwenden den Ausdruck "Deskriptorvektor", aber gelegentlich wird er als "Merkmalsvektor" oder als "SIFT-Merkmale" bezeichnet, möglicherweise um auf die Intuition des maschinellen Lernens zurückzugreifen .

SIFT analysiert das Bild, identifiziert eine Reihe von Schlüsselpunkten (eine Reihe von Punkten im Bild, die für die Ausrichtung hilfreich sind) und berechnet dann für jeden Schlüsselpunkt einen Deskriptorvektor (einen Merkmalsvektor). Dann werden die Deskriptorvektoren für die Schlüsselpunkte in Bild und die Deskriptorvektoren für die Schlüsselpunkte in Bild , um zu versuchen, die beiden Bilder aneinander auszurichten. Die Intuition ist, dass, wenn der Deskriptorvektor für einen Schlüsselpunkt in Bild einem Deskriptorvektor für einen Schlüsselpunkt in Bild "ähnlich" ist, diese beiden Punkte möglicherweise zueinander ausgerichtet werden sollten. Hier wird "Ähnlichkeit" durch den euklidischen Abstand zwischen den beiden Deskriptorvektoren gemessen.ich1ich2ich1ich2

Somit ist ein Deskriptorvektor für einen Schlüsselpunkt ein Vektor, z. B. in , der so gewählt wird, dass der Deskriptorvektor für diesen Punkt gewinnt, wenn das Bild übersetzt, skaliert, gedreht usw. wird. durch die Transformation nicht viel verändert werden.R.128

Eine angemessene Beschreibung von SIFT finden Sie in Wikipedia: https://en.wikipedia.org/wiki/Scale-invariant_feature_transform

DW
quelle
Ich finde die Antwort hilfreich und frage mich, warum sie nicht akzeptiert wird.
Gsamaras