Ich versuche, mir etwas über das WHT beizubringen, aber es scheint nirgendwo im Internet viele gute Erklärungen dafür zu geben. Ich glaube, ich habe herausgefunden, wie man das WHT berechnet, aber ich versuche wirklich zu verstehen, warum es innerhalb der Bilderkennungsdomäne als nützlich angesehen wird.
Was ist das Besondere daran und welche Eigenschaften bringt es in einem Signal hervor, das bei klassischen Fourier-Transformationen oder anderen Wavelet-Transformationen nicht auftritt? Warum ist es für die Objekterkennung nützlich, wie hier ausgeführt ?
image-processing
Spacey
quelle
quelle
Antworten:
Die NASA verwendete die Hadamard-Transformation in den 1960er und frühen 1970er Jahren als Grundlage für die Komprimierung von Fotos interplanetarer Sonden. Hadamard ist ein rechnerisch einfacherer Ersatz für die Fourier-Transformation, da keine Multiplikations- oder Divisionsoperationen erforderlich sind (alle Faktoren sind plus oder minus eins). Multiplikations- und Divisionsoperationen waren auf den kleinen Computern, die an Bord dieser Raumfahrzeuge verwendet wurden, äußerst zeitintensiv, so dass deren Vermeidung sowohl hinsichtlich der Rechenzeit als auch des Energieverbrauchs von Vorteil war. Seit der Entwicklung schnellerer Computer mit Single-Cycle-Multiplikatoren und der Perfektionierung neuerer Algorithmen wie der Fast Fourier Transform sowie der Entwicklung von JPEG, MPEG und anderer Bildkomprimierung ist Hadamard meiner Meinung nach nicht mehr im Einsatz. Jedoch, Ich verstehe, es könnte ein Comeback für den Einsatz im Quantencomputer sein. (Die Verwendung durch die NASA stammt aus einem alten Artikel in den NASA Tech Briefs; genaue Zuordnung nicht verfügbar.)
quelle
Die Koeffizienten der Hadamard-Transformation sind alle +1 oder -1. Die schnelle Hadamard-Transformation kann daher auf Additions- und Subtraktionsoperationen (keine Division oder Multiplikation) reduziert werden. Dies ermöglicht die Verwendung einer einfacheren Hardware zur Berechnung der Transformation.
Hardwarekosten oder -geschwindigkeit können daher der wünschenswerte Aspekt der Hadamard-Transformation sein.
quelle
Schauen Sie sich dieses Papier an, wenn Sie Zugriff haben. Ich habe das Abstract hier eingefügt. Pratt, WK; Kane, J .; Andrews, HC; "Hadamard Transform Image Coding", Proceedings of the IEEE, Band 57, Nr. 1, S. 58-68, Januar 1969, doi: 10.1109 / PROC.1969.6869 URL: http://ieeexplore.ieee.org/stamp /stamp.jsp?tp=&arnumber=1448799&isnumber=31116
Die Einführung des schnellen Fourier-Transformations-Algorithmus hat zur Entwicklung der Fourier-Transformations-Bildcodiertechnik geführt, bei der die zweidimensionale Fourier-Transformation eines Bildes über einen Kanal und nicht über das Bild selbst übertragen wird. Diese Entwicklung hat ferner zu einer verwandten Bildcodierungstechnik geführt, bei der ein Bild durch einen Hadamard-Matrixoperator transformiert wird. Die Hadamard-Matrix ist eine quadratische Anordnung von Plus und Minus, deren Zeilen und Spalten orthogonal zueinander sind. Ein Hochgeschwindigkeits-Berechnungsalgorithmus, ähnlich dem schnellen Fourier-Transformationsalgorithmus, der die Hadamard-Transformation durchführt, wurde entwickelt. Da bei der Hadamard-Transformation nur Additionen und Subtraktionen von reellen Zahlen erforderlich sind, ist ein Geschwindigkeitsvorteil in der Größenordnung gegenüber der Fourier-Transformation mit komplexen Zahlen möglich.
quelle
Ich möchte hinzufügen, dass jede m-Transformation (durch eine m-Sequenz erzeugte Toeplitz-Matrix) in zerlegt werden kann
P1 * WHT * P2
Wobei WHT die Walsh-Hadamard-Transformation ist, sind P1 und P2 Permutationen (siehe http://dl.acm.org/citation.cfm?id=114749 ).
m-transform wird für eine Reihe von Dingen verwendet: (1) Systemidentifikation, wenn das System von Rauschen geplagt ist, und (2) durch virtuelles Identifizieren von (1) Phasenverzögerung in einem System, das von Rauschen geplagt ist
Für (1) stellt m-transform den oder die Systemkerne wieder her, wenn der Stimulus eine m-Sequenz ist, was in der Neurophysiologie nützlich ist (z . B. http://jn.physiology.org/content/99/1/367). voll und andere), weil es eine hohe Leistung für ein Breitbandsignal ist.
Für (2) wird Gold-Code aus m-Sequenzen konstruiert (http://en.wikipedia.org/wiki/Gold_code).
quelle
Ich bin sehr froh, eine Wiederbelebung der Walsh-Paley-Hadamard-Transformationen (oder manchmal auch Waleymard-Transformationen genannt) zu beobachten. Siehe Wie können wir die Hadamard-Transformation für die Feature-Extraktion aus einem Bild verwenden?
Als solche können sie mit einer sehr billigen Implementierung in jeder Anwendung verwendet werden, in der Kosinus / Sinus- oder Wavelet-Basen verwendet werden. Bei ganzzahligen Daten können sie ganzzahlig bleiben und wirklich verlustfreie Transformationen und Komprimierungen ermöglichen (ähnlich wie bei ganzzahligen DCT- oder binären Wavelets oder Binlets). So kann man sie in Binärcodes verwenden.
Ihre Leistung wird oft als schlechter als andere harmonische Transformationen auf natürlichen Signalen und Bildern angesehen, da sie blockartig sind. Einige Varianten werden jedoch weiterhin verwendet, beispielsweise für umkehrbare Farbtransformationen (RCT) oder Videocodierungstransformationen mit geringer Komplexität (Transformation und Quantisierung mit geringer Komplexität in H.264 / AVC ).
Einige Literatur:
quelle
Einige Links: Webseite
Allgemeine Beschreibung
Für die Gaußsche Verteilung
Bericht
quelle