Das Verständnis der Skalenraumtheorie

10

In der Scale-Space - Theorie der Scale-Space - Darstellung des Signal , (im Fall von Bild d = 2 ) ist gegeben als: L ( x , y ; t ) = g ( x , y ; t ) f ( x , y ) wobei g ( x ,f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y) ist ein Gaußscher Kern mit dem Parameter t und ist eine Faltung. Durch Ändern des t- Parameters erhalten wir ein mehr oder weniger geglättetes Bild. Infolgedessen enthält eine gröbere Darstellung (Parameter t ) keine kleinen Objekte oder Rauschen.g(x,y;t)ttt

Der Hauptpunkt ist, einen Weg zur skaleninvarianten Merkmalserkennung zu finden, oder? Damit bei einigen Bildern mit verkleinerter Größe die Funktionen wie Schlüsselpunkte korrekt erkannt werden, auch wenn die Größe unterschiedlich ist, ohne dass andere Rauschschlüsselpunkte gefunden werden.

  1. In der Arbeit verwenden sie die normalisierten Derivate. δ ξ , γ - n o r m = t γ / 2 δ x . Was bedeutet die Verwendung des γ- normalisierten Derivats, wie hilft es bei der Skaleninvarianz?γδξ,γnorm=tγ/2δxγ

  2. Auf diesem Bild können wir sehen, dass sich an nahezu denselben Positionen die verschiedenen Schlüsselpunkte befinden (unterschiedlich groß). Wie ist das möglich?

Erkannte Merkmale

x,ytL(x,y)t

Das Papier, das ich gelesen habe, ist: Funktionserkennung mit automatischer Skalenauswahl

maximus
quelle

Antworten:

3
  1. γtt

  2. Sie können Schlüsselpunkte in mehreren Maßstäben an derselben Stelle finden. Das liegt daran, dass Sie nach den lokalen Maxima über Skalen suchen . Hier ist die Intuition: Denken Sie an ein Bild eines Gesichts. Bei einer feinen Skala erhalten Sie einen Klecks, der der Nase entspricht. Auf einer Kursskala erhalten Sie einen Blob, der dem gesamten Gesicht entspricht. Die beiden Blobs sind am selben Punkt zentriert, haben jedoch unterschiedliche Maßstäbe.

  3. Hier ist der gesamte Algorithmus:

    • Entscheiden Sie, für welche Bildfunktionen Sie sich interessieren (z. B. Blobs, Ecken, Kanten).
    • Definieren Sie eine entsprechende "Detektorfunktion" in Bezug auf Ableitungen, z. B. einen Laplace-Wert für Blobs.
    • Berechnen Sie Ableitungen, die Sie für Ihre Detektorfunktion benötigen, in verschiedenen Maßstäben.
    • tmγ/2m
    • Berechnen Sie die Detektorfunktion über den gesamten Skalenraum.
    • x,y,t
    • Dies sind Ihre Interessenpunkte oder Schlüsselpunkte.

Bearbeiten:

  1. tγ/2
  2. txytxy
  3. Sie möchten lokale Maxima über Skalen hinweg finden, da Sie möglicherweise Bildmerkmale unterschiedlicher Größe am selben Ort haben. Stellen Sie sich ein Bild konzentrischer Kreise vor, wie ein Volltreffer. Es gibt Ihnen hohe Antworten eines Laplace auf mehreren Skalen. Oder denken Sie an ein Bild eines echten menschlichen Auges, das von einem Laplace in verschiedenen Maßstäben gefiltert wurde. Sie erhalten eine hohe Reaktion auf einer feinen Skala für die Pupille, eine hohe Reaktion auf einer mittleren Skala für die Iris und eine hohe Reaktion auf einer groben Skala für das gesamte Auge.

Der springende Punkt ist, dass Sie nicht wissen, in welchem ​​Maßstab die interessierenden Merkmale im Voraus sein könnten. Sie sehen sich also alle Skalen an.

Dima
quelle
tγ/2tttx,y
x,y,tt
@maximus Bitte beachten Sie die Bearbeitung der Antwort.
Dima
@maximus, ich habe es vorher falsch verstanden. Gamma ist nicht die Skalierungsstufe. Ich habe die Antwort korrigiert.
Dima