Wofür eignet sich Lanczos Resampling im räumlichen Kontext?

46

GDAL enthält eine Resampling-Methode, die über die normale Mischung aus Nearest Neighbor, Bilinear, Cubic und Splines hinausgeht: "Lanczos windowed sinc resampling". Ich verstehe, dass dies ein Faltungsfilter ist, aber im Gegensatz zu Bildern, bei denen die Ergebnisse eher subjektiv sind, hat das für räumliche Daten verwendete Resampling andere Auswirkungen. Was ist Lanczos und wie wirkt sich die Verwendung auf die Ausgabe aus?

scw
quelle
4
Dies ist ein genaues Duplikat von stackoverflow.com/questions/1854146/…, das eine gute Antwort hat.
whuber
Abschnitt 4 eines Artikels von Claude Duchon aus dem Jahr 1979 könnte hilfreich sein.
whuber

Antworten:

72

Was ist Lanczos Resampling?

Obwohl die Theorie in einem frühen Artikel und im Wikipedia-Artikel beschrieben ist , kann ein "Gefühl" für Resampling-Methoden am besten durch Berechnen auf einfachen oder Standardbildern erhalten werden. Dies kann ein umfangreiches Thema sein, das umfangreiche Experimente erfordert, aber es gibt einige Vereinfachungen:

  • Diese Operatoren arbeiten in jedem Farbkanal separat. Daher reicht es aus, zu untersuchen, wie sie auf einem monochromen Bild ("Schwarzweißbild") arbeiten.

  • Die meisten in der Bildverarbeitung verwendeten Faltungsoperatoren arbeiten in x- und y-Richtung und unabhängig voneinander in beiden Richtungen gleich. Tatsächlich handelt es sich um eindimensionale Operatoren, die zuerst auf die Zeilen und dann auf die Spalten angewendet werden. Dies bedeutet, dass wir sie untersuchen können, indem wir "1D" -Bilder untersuchen, die detailliert aufgezeichnet werden können.

  • Alles, was wir über einen linearen Operator wissen müssen (der alle Faltungsoperatoren enthält), lässt sich daraus ableiten, wie ein Operator mit dem einfachsten nicht konstanten Bild von allen arbeitet: Dies ist ein plötzlicher Sprung von einem Wert zu einem anderen.

Schauen wir uns einige der gängigen Resampling-Methoden an. Tatsächlich benötigen wir zwei Abbildungen: eine, um zu zeigen, was beim "Downsampling" passiert, wobei das neue Bild gröber als das alte ist, und eine weitere, um das "Upsampling" zu betrachten, bei dem die neuen Bilder die alten verfeinern. Beginnen wir mit letzterem, weil es mehr Details zeigt.

Upsampling

Resampling von 7 bis 80 Zellen als Bilder

Das Originalbild auf der linken Seite (7 x 7) ist wirklich eindimensional, da jede Zeile gleich ist. Das Resampling erfolgt spaltenübergreifend. Die Dimension der anderen fünf Bilder ist 80 mal 80, was detailliert zeigt, wie jede Methode zwischen den ursprünglichen groben Pixeln interpoliert. Bei der Nearest-Neighbour-Abtastung bleibt die scharfe Trennung zwischen Dunkel und Hell erhalten, während die anderen vier Methoden den dazwischenliegenden Bereich in gewissem Maße verwischen. Insbesondere erzeugt der Lanczos-Resampler Bereiche, die dunkler sind als die Originalbereiche, und Bereiche, die heller sind als die Originalbereiche. (Dies kann Auswirkungen auf die GIS-Arbeit haben, da eine solche Hochrechnungvon den ursprünglichen Werten kann möglicherweise dazu führen, dass die neuen Werte ungültig sind. Sie können sich auch über den Bereich der ursprünglichen Farbkarte hinaus erstrecken, was manchmal dazu führt, dass die Extremwerte im Resampling-Bild falsch wiedergegeben werden. Dies ist beispielsweise ein Problem beim Resampling der bikubischen Faltung in ArcGIS.)

(Hinweis: Die hier gezeigte "bikubische" Methode ist ein bikubischer Spline, nicht die "bikubische Faltung" von ArcGIS.)

Die Verwendung von Helligkeit zur Darstellung von Bildwerten ist, obwohl natürlich, nicht sehr präzise. Die nächste Abbildung korrigiert dies, indem die Zellenwerte (vertikale Achse) spaltenweise (horizontale Achse) grafisch dargestellt werden.

Resampling von 7 bis 80 Zellen als Plots

Niedrigere Werte in den Diagrammen entsprechen dunkleren Teilen der Bilder. Eine sorgfältige Prüfung des Originals deckt eine versteckte Annahme auf: Obwohl das Originalbild wie ein scharfer Sprung von dunkel nach hell aussieht , erfolgt der Sprung tatsächlich über ein Siebtel (1/7) der Ausdehnung der Spalten. Wer soll sagen, was in der Original-Szene, die das Bild zeigt, wirklich in diesem Intervall passiert? Wir sollten daher die Unterschiede zwischen den Resampling-Methoden, die in diesem kurzen Intervall auftreten, nicht zu kritisch betrachten: Jede gibt eine andere, aber möglicherweise gleichwertige Darstellung dessen, was in der Originalszene auftreten könnte . In diesem Sinne ist es nicht länger offensichtlich, dass das Abtasten des nächsten Nachbarn die genaueste Interpolationsmethode ist.

Eine Schlussfolgerung, die wir ziehen sollten, ist, dass die Genauigkeit einer Upsampling-Methode von der Art der zugrunde liegenden Szene abhängt . Wenn die Szene aus Werten besteht, die sich gleichmäßig von einem Punkt zum nächsten ändern sollten, ist die Methode des nächsten Nachbarn wahrscheinlich die Methode mit der geringsten Wiederholungsgenauigkeit unter den gezeigten.

Downsampling

Downsampled Bilder

Hier sehen wir das Ergebnis des Downsamplings eines 16 x 16-Bildes auf 8 x 8-Bilder (eine 2 x 2-Aggregation). Der nächste Nachbar behält die scharfe Grenze genau bei. Lanczos unterscheidet sich von den anderen durch die Verbesserung der scheinbaren Schärfe. Ein genauer Blick zeigt, dass der dunkle Bereich auf der einen Seite der Begrenzung und der helle Bereich auf der anderen Seite aufgehellt werden. Die Grafiken verdeutlichen dies:

Grafiken von heruntergerechneten Bildern

Die bilinearen, bikubischen und Gaußschen Resampler zeigen Eigenschaften von Faltungsoperatoren, die alle positive Gewichte (oder sehr kleine negative Gewichte) aufweisen: sie mitteln oder "schmieren" benachbarte Werte. Beim Downsampling werden scharfe Merkmale unscharf. Das Ausmaß der Unschärfe hängt von der Breite des Kernels ab. Wie diese anderen verwischt auch der Lanczos-Resampler den Sprung, "überschießt" ihn jedoch auf beiden Seiten. Das ist die Kontrastverbesserung, die oben in den Bildern selbst zu sehen ist. Aufgrund dieser Tendenz, den Kontrast zu erhöhen (die lokalen Unterschiede zwischen den Höhen und Tiefen im Bild), wird der Lanczos-Resampler oft als "Schärfungsfilter" bezeichnet. Diese Grafiken zeigen, dass diese Charakterisierung ein differenziertes Verständnis erfordert, weil es offensichtlich die Mittelung der Werte auf beiden Seiten des Sprunges nicht wirklich verringert. Bei Pixel 4 ist sein Wert von 0,56 mit den von den anderen Faltungsfiltern berechneten Werten vergleichbar.

Wie wirkt sich die Verwendung auf die Ausgabe aus?

Schauen wir uns an, was in einem komplexeren Bild passiert.

Resamples eines komplexen Bildes

Das Original, das ein 13 x 13-Bild ist, enthält jetzt ein Muster mit der höchstmöglichen räumlichen Frequenz (abwechselnd hell und dunkel mit jeder Spalte auf der rechten Seite). Wir können nicht hoffen, solche Merkmale beim Downsampling zu reproduzieren: Die geringere Anzahl von Pixeln kann einfach nicht alle diese Informationen enthalten. Konzentrieren wir uns nun darauf, was passiert, wenn ein solches Bild aufgespielt wird. Wenn wir uns um eine originalgetreue Wiedergabe der Szene bemühen, möchten wir, dass dieses Hochfrequenzmuster genau wiedergegeben wird.

Die kleineren Bilder werden auf 25 x 25 Pixel neu abgetastet: fast, aber nicht ganz, eine 2: 1-Verfeinerung. Meines Erachtens reproduzieren die Lanczos-Methode und die bilineare Methode die Streifen unter den vier Faltungs-Resamplern am schärfsten. Der nächste Nachbar ist natürlich der treueste (weil er überhaupt keine Durchschnittswerte ermitteln kann).

Graphen des komplexen Bildes neu abgetastet

Diese Diagramme mit denselben Ergebnissen zeigen, dass der Lanczos-Resampler den Kontrast in den Streifen (gemessen an der Größe der vertikalen Schwankungen von Tief zu Hoch) auf Kosten einer Intensitätsänderung innerhalb des Lichts mit konstantem Wert beibehalten konnte Bereich in der Bildmitte (Pixel 5, 6, 7 des Originals). Diese Variation erscheint als streifenartige Artefakte im hellen Teil des Bildes (in der Mitte). Von den hier gezeigten Resamplern führt nur einer solche unechten Details ein.

Wofür ist es in einer räumlichen Anwendung nützlich?

Offensichtlich ist Lanczos Resampling keine Allheilmittel- oder Omnibus-Lösung für das Resampling. Es ist vielen anderen Faltungs-Resamplern überlegen, wenn es darum geht, den lokalen Kontrast aufrechtzuerhalten (oder sogar zu verbessern). Dies kann nützlich sein, wenn das neu abgetastete Bild zum Anzeigen der Identifizierung detaillierter Merkmale oder Grenzen vorgesehen ist. Wenn das neu abgetastete Bild anschließend analysiert oder verarbeitet wird, kann die Lanczos-Neuabtastung die Fähigkeit verbessern, Kanten und lineare Merkmale zu erkennen.

Wenn das neu abgetastete Bild jedoch auf andere Weise analysiert wird, sind die Vorteile der Lanczos-Neuabtastung zweifelhaft. Dies erhöht typischerweise (künstlich) die lokalen Maße der räumlichen Variabilität, wie z. B. Fokusbereiche und Fokusstandardabweichungen. Insgesamt hat dies keine Auswirkung auf die räumlichen Mittelwerte - wie bei den anderen Resamplern für Faltungen wird es normalerweise normalisiert (was bedeutet, dass es sich um einen lokal gewichteten Durchschnitt handelt, ohne dass eine Verzerrung eingeführt wurde) andere Resampler.

Die (notwendigerweise kurze) Auswertung hier legt nahe, dass der Lanczos-Resampler im Allgemeinen nicht für das Downsampling verwendet werden sollte: Für diese Anwendung scheint es nichts zu bieten, was einfachere (und allgemeiner verfügbare) Methoden bieten, die den potenziellen Nachteil der Extrapolation über den ursprünglichen Bereich hinaus beibehalten von Datenwerten.

Nachwort: ein allgemeiner Kommentar

Die hier beschriebene Untersuchung ist ein Beispiel dafür, was jeder tun kann, wenn er eine Frage zur Funktionsweise eines GIS-Vorgangs hat. Es verwendet das GIS selbst als Untersuchungsgegenstand: Um zu wissen, was eine Operation oder Analysemethode bewirkt, wenden Sie es einfach unter kontrollierten experimentellen Bedingungen an. In diesem Fall müssen einfache Testbilder erstellt, nach den verfügbaren Methoden erneut abgetastet und die Ergebnisse überprüft werden.

Es gibt drei wichtige Aspekte dieses Ansatzes, um zu lernen, wie GIS funktioniert:

  1. Theorie . Das Experimentieren kann normalerweise nicht "blind" durchgeführt werden: Es hilft, eine Theorie zu kennen. Wir müssen normalerweise nicht viel wissen, aber wir brauchen die Grundlagen. In diesem Fall hat die Faltungstheorie die Anzahl und Art der Bilder, mit denen wir experimentieren müssen, stark reduziert. Wir mussten nichts über Fourier-Analyse usw. wissen. (Machen Sie keinen Fehler, solche Kenntnisse sind von Vorteil. Aber der Mangel an Fachkenntnissen dieser Art sollte uns nicht aufhalten.)
  2. Übe . Indem wir unser GIS selbst verwenden, um das Experiment durchzuführen, können wir sehen, was es tatsächlich tut . Dadurch wird vermieden , trennt zwischen Theorie (die uns sagt , was die Software sollte tun) und Praxis (das ist , was es wirklich tut).
  3. Quantifizierung . Sofern die Frage nicht die visuelle Wahrnehmung betrifft, sollten wir uns zur Bewertung der Ergebnisse nicht ausschließlich auf das Betrachten von Karten (oder in diesem Fall von Bildern) verlassen. Um die besten Informationen zu erhalten, müssen wir die Ausgabe quantifizieren (hier mit Diagrammen) und sie häufig mit statistischen Methoden beschreiben und zusammenfassen.
whuber
quelle
3

Möglicherweise kennen Sie Lanczos-Filter oder ähnliche Filter aus Ihren Bildprogrammen, die häufig als "Schärfungsfilter" bezeichnet werden. Ein gutes Beispiel aus diesem Forenthema : Das erste Bild zeigt die Originaldatei und daneben, wie sie nach einer Reduzierung der Rastergröße aussehen würde, wenn Sie eine glatte Interpolationsmethode verwenden (z. B. bikubisches Downsampling).

http://peltarion.eu/img/comp/moire/D_lanczos3.jpg Wenn Sie jedoch einen Lanczos-Filter auf dieses Bild anwenden oder es zum erneuten Abtasten verwenden, werden die Unterschiede verstärkt. Sie können also sagen, dass der Kontrast lokal erhöht wird. Bildbeschreibung hier eingeben

Bei räumlichen Daten kann dies sehr nützlich sein: Stellen Sie sich vor, Sie versuchen, eine gerasterte Polygonkarte zu verkleinern, oder Sie möchten Algorithmen ausführen, die auf der Kantenerkennung beruhen (z. B. Digitalisierung einer gescannten Polygonkarte, Bildsegmentierung ( Beispiel )).

Andererseits verlieren Sie möglicherweise etwas an räumlicher Genauigkeit. Stellen Sie sich vor, dass die 16x16-Karte die Luftverschmutzung in einer Stadt darstellt, während die Neuabtastung, bei der der Mittelwert verwendet wird, die durchschnittliche Luftverschmutzung in dieser Gitterzelle angemessener darstellt.

johanvdw
quelle
Ich denke nicht, dass diese Bilder das sind, was Sie behaupten. Oben rechts ist eindeutig nicht der Zellenmittelwert. Wäre dies der Fall, wären die vertikalen Streifen in seinem oberen linken Quadranten nicht vorhanden. Auf dieses Bild wurde eine Art "Schärfen" angewendet , um das darunter liegende Bild (rechts unten) zu erhalten, das fälschlicherweise verzerrt ist: Dies ist nicht die Erhaltung von Merkmalen, sondern die Erzeugung von Artefakten. Da (fast) alle Filter einheitennormalisiert sind, einschließlich der Lanczos-Filter, gilt Ihr Punkt über den Mittelwert für jeden von ihnen, nicht nur für einen ungewichteten Nachbarschaftsmittelwert, und ist daher kein Unterscheidungsmerkmal.
Whuber
Ich habe Ihre Kommentare integriert. Aber innerhalb der Zelle würde der glatte Interpolator höchstwahrscheinlich eine bessere Vorhersage liefern
johanvdw
-1

Aus Wikipedia :

Lanczos Resampling (ungarische Aussprache: [ˈlaˈntsoʃ]) ist eine Interpolationsmethode, mit der neue Werte für abgetastete Daten berechnet werden. Es wird häufig bei der multivariaten Interpolation verwendet, z. B. zur Bildskalierung (zum Ändern der Größe digitaler Bilder), kann jedoch für jedes andere digitale Signal verwendet werden. Der Lanczos-Kernel gibt an, welche Stichproben in den Originaldaten und in welchem ​​Verhältnis jede Stichprobe der endgültigen Daten ausmachen. Der Filter wurde nach Cornelius Lanczos benannt, weil er zeigte, wie man Fourier-Reihen und Chebyshev-Polynome für verschiedene Probleme verwendet, bei denen er zuvor nicht verwendet wurde.

Anwendung : Der Lanczos-Filter ist eine fenstergesteuerte Form des Sinc-Filters, eines theoretisch optimalen "Brick-Wall" -Tiefpassfilters. Die sinc-Funktion ist unendlich groß und daher in der Praxis nicht direkt anwendbar. Stattdessen werden Approximationen verwendet, die als Fensterformen des Filters bezeichnet werden, wie in den Fensterfunktionen beschrieben: Filterdesign, und der Lanczos-Filter ist eine solche Fensterung. Die Fenster verschwinden außerhalb eines Bereichs, und die Verwendung größerer Bereiche ermöglicht es, die Genauigkeit im Austausch für mehr Berechnung zu verbessern.

Bewertung : Der Lanczos-Filter wurde mit anderen Filtern verglichen, insbesondere mit anderen Fenstern des Zinkfilters. Einige haben festgestellt, dass die Lanczos (mit a = 2) den "besten Kompromiss in Bezug auf die Reduzierung von Aliasing, Schärfe und minimalem Nachschwingen" im Vergleich zu Sinc-Abschnitten und Sinc-Fenstern mit Barlett-, Cosinus- und Hann-Fenstern darstellen.

Einschränkung : Da der Kernel negative Werte für a> 1 annimmt, können Ausgabewerte auch bei nicht negativer Eingabe negativ sein. Negative Werte sind für Bildsignale nicht zulässig und verursachen Schnittartefakte. Negative Lappen induzieren auch klingelnde Artefakte.

Sowohl das Unterschwingen als auch das Nachschwingen sind jedoch im Vergleich zum (nicht mit Fenstern versehenen) Zinkfilter aufgrund der Fensterbildung verringert. das Klingeln ist besonders klein, wie die positive Nebenkeulengröße zeigt, insbesondere für a = 2.

Chethan S.
quelle
Warum abstimmen? Was ist falsch an dieser Antwort? Ich habe auch den Originallink angegeben.
Chethan S.
7
Ich verstehe nicht, wie der Wiki-Extrakt die Frage beantwortet, welche Auswirkungen der Lanczos-Filter auf Geodaten hat und wofür er nützlich wäre.
underdark
Das ist richtig. Ich habe nur die Antwort im Allgemeinen für Was ist Lanczos gegeben und wie wirkt sich die Verwendung auf die Ausgabe aus?
Chethan S.
9
Der größte Teil dieses Wikipedia-Artikels ist zu vage, um hilfreich zu sein (wie andere bereits bemerkt haben). Die Antwort liegt zwar im allerletzten Satz, wäre aber nur für jemanden verständlich, der weiß, was "Unterschwingen" und "Klingeln" sind (auch bekannt als "Gibbs-Schwingung" in 2D), der weiß, worauf die "positive Seite" verweist und versteht die Beziehungen zwischen Kernelformen und deren Auswirkungen auf Fouriertransformationen sehr gut. Kurz gesagt, um verständlich und nützlich zu sein, muss diese Antwort etwas präzisiert werden.
whuber