Ich bin ein Masterstudent und bereite ein Seminar in Computer Vision vor. Zu den Themen gehört der Kanade-Lucas-Tomasi-Tracker (KLT), wie in beschrieben
J. Shi, C. Tomasi, "Gute Eigenschaften zu verfolgen" . Verfahren CVPR '94.
Hier ist eine Webressource , mit der ich den KLT-Tracker verstehe. Ich brauche etwas Hilfe bei der Mathematik, da ich in der linearen Algebra ein bisschen eingerostet bin und keine Vorkenntnisse im Bereich Computer Vision habe.
Beachten Sie in dieser Formel für (Schritt 5 in der Zusammenfassung) das inverse Hessische:
In diesem Artikel werden zu verfolgende Merkmale als solche definiert, bei denen die Summe der inversen hessischen Matrizen große, ähnliche Eigenwerte aufweist: . Ich konnte nicht verstehen, wie und woher dies mathematisch stammt.
Die Intuition ist, dass dies eine Ecke darstellt; Ich verstehe das. Was hat das mit Eigenwerten zu tun? Ich gehe davon aus, dass sich bei niedrigen hessischen Werten nichts ändert und es keine Ecke gibt. Wenn sie hoch sind, ist es eine Ecke. Weiß jemand, wie die Intuition der Kornnähe in den Eigenwerten des inversen Hessischen zum Tragen kommt, um über Iterationen des KLT-Trackers zu bestimmen ?
Ich konnte Ressourcen finden, die behaupten, dass das inverse Hessische mit der Bildkovarianzmatrix korreliert. Darüber hinaus zeigt die Bildkovarianz die Intensitätsänderung an, und dann ist es sinnvoll ... aber ich konnte nicht genau herausfinden, was eine Bildkovarianzmatrix in Bezug auf ein Bild und nicht auf einen Vektor oder eine Sammlung von Bildern ist.
Auch Eigenwerte haben im Prinzip eine Bedeutung für die Komponentenanalyse, weshalb ich auf die Idee einer Bild-Kovarianz-Matrix komme, aber ich bin nicht sicher, wie ich dies auf das Hessische anwenden soll, wie es normalerweise auf ein Bild angewendet wird. Das Hessische ist meines Wissens eine Matrix, die an einer bestimmten Stelle die 2. Ableitung für , und .x y x y ( x , y )
Ich wäre sehr dankbar, wenn Sie mir dabei helfen könnten, da ich schon seit mehr als drei Tagen dabei bin. Es ist nur eine kleine Formel, und die Zeit läuft davon.
quelle
Antworten:
Stellen Sie sie sich als 2D-Glättungsbegriffe vor.
Je glatter das Patch ist, desto niedriger ist der Matrixrang und desto näher ist die Matrix an der Singularität.
An einer geraden Kante (nicht an einer Ecke) ist nur ein Eigenwert groß.
An einer Ecke werden beide groß sein.
Die Verwendung von Eigenwerten bedeutet, dass der Winkel der Kante kein Faktor ist und in jedem Winkel eine Kante nur ein großes ev ergibt
quelle