Soll man bei Rastern mit unterschiedlichen Auflösungen auf die höchste oder niedrigste Auflösung resampeln?

16

Ich suche Empfehlungen zu bewährten Methoden für den Umgang mit Rasterdatenebenen mit unterschiedlichen Auflösungen und Projektionen. Der Rat, den ich erhalten habe, besteht darin, immer die Ebene mit der niedrigsten Auflösung erneut abzutasten, bevor ich eine Analyse durchführe. Dies scheint mir jedoch eine enorme Verschwendung von Präzision zu sein, und ich habe nie eine solide Erklärung dafür erhalten, warum dies getan werden sollte.

Wann ist es sinnvoll, eine Neuabtastung durchzuführen, um sie an ein Raster mit höherer Auflösung anzupassen, und was bedeutet dies im Vergleich zur Neuabtastung auf eine niedrigere Auflösung?

Mir ist klar, dass dies wahrscheinlich sehr situationsabhängig ist. Ich suche hauptsächlich nach allgemeinen Richtlinien, aber hier ist mein spezielles Referenzszenario:

Szenario: Ich möchte ein räumliches Regressionsmodell aufbauen, das die Landnutzung auf der Grundlage verschiedener ökologischer und sozioökonomischer Ebenen vorhersagt. Meine Landnutzungskarte ist von Landsat abgeleitet und daher 30m Auflösung. Beispiele für erklärende Schichten sind SRTM DEM (3 Bogensekunden, ~ 90 m) und Bioclim Climate Layer (30 Bogensekunden, ~ 1 km).

Matt SM
quelle
1
Könnten Sie uns bitte nähere Informationen zum Regressionsmodell und zur Umsetzungsmethode geben? +1 für eine gut konstruierte, interessante Frage!
Aaron
Ich vergleiche die Waldbedeckung zu zwei Zeitpunkten und verwende als Antwort ein logistisches Regressionsmodell mit (binärer) Wahrscheinlichkeit der Entwaldung. Ich werde es in R.
Matt SM

Antworten:

17

Eigentlich ist es nicht alles situationsabhängig und dreht sich alles um statistische Fehler.

Jedes Mal, wenn Sie auf eine höhere Auflösung resampeln, führen Sie eine falsche Genauigkeit ein. Betrachten Sie einen Datensatz, der nur in Fuß bei ganzen Zahlen gemessen wird. Jeder gegebene Punkt kann +/- 0,5 Fuß von seiner tatsächlichen Position entfernt sein. Wenn Sie zum nächsten Zehntel resampeln, sagen Sie jetzt, dass eine bestimmte Zahl nicht mehr als +/- 0,1 von ihrer tatsächlichen Position entfernt ist. Sie wissen jedoch, dass Ihre ursprünglichen Messungen nicht so genau waren, und arbeiten jetzt innerhalb der Fehlergrenze. Wenn Sie jedoch in die andere Richtung gehen und erneut auf die niedrigere Auflösung setzen, wissen Sie, dass jeder gegebene Punktwert definitiv genau ist, da er in der Fehlertoleranz des größeren Samples enthalten ist.

Außerhalb der statistischen Mathematik ist die Landvermessung der erste Punkt, an den man sich erinnert. In älteren Umfragen wurden nur Peilungen bis zur nächsten halben Minute und Entfernungen von einem Zehntel Fuß angegeben. Das Zeichnen einer Grenzüberschreitung mit diesen Messungen kann häufig zu einer Fehleinschätzung führen (Start- und Endpunkt sollten identisch sein, werden jedoch nicht angegeben), die in Fuß gemessen wird. Moderne Vermessungen gehen mindestens bis zur nächsten Sekunde und Hundertstel Fuß. Abgeleitete Werte (z. B. die Fläche einer Partie) können durch den Genauigkeitsunterschied erheblich beeinflusst werden. Der abgeleitete Wert selbst kann auch als zu genau angegeben werden.

Wenn Sie in Ihrem Analysefall auf die höhere Auflösung resampeln, implizieren Ihre Ergebnisse eine viel größere Genauigkeit als die Daten, auf denen sie basieren. Betrachten Sie Ihre SRTM auf 90 m. Mit welcher Methode auch immer sie die Höhe messen (Durchschnitt / Maximum / mittlere Rendite), die kleinste Einheit (Pixel), die von ihren Nachbarn unterschieden werden kann, ist 90 m. Wenn Sie das erneut auf 30 m abtasten, haben Sie folgende Möglichkeiten:

  • Sie nehmen an, dass alle neun der resultierenden Pixel dieselbe Höhe haben, obwohl in Wahrheit nur eines - die Mitte oder die obere linke - (oder keine!) ist
  • Sie interpolieren zwischen Pixeln und erstellen abgeleitete Werte, die vorher nicht vorhanden waren

In beiden Fällen führen Sie daher eine falsche Genauigkeit ein, da Ihre neuen Unterproben nicht tatsächlich gemessen wurden.

Verwandte Frage: Welche Methoden stehen zur Modellierung der Bodeneignung zur Verfügung?

Chris W
quelle
Das gilt sicherlich für Punktdaten. Aber ich frage mich, ob es für Rasterdaten, die einen Durchschnitt einer sich ständig ändernden räumlichen Größe bilden, anders ist, wenn es eine Genauigkeit der Position und eine Genauigkeit der gemessenen Größe gibt. Unterschiedliche Größen haben auch unterschiedliche räumliche Variationsgrade. Das erneute Abtasten von Höhendaten auf eine höhere Auflösung muss beispielsweise in Berggebieten mehr Fehler verursachen als in der Prärie.
Matt SM
@MattSM Dies gilt für alle räumlichen Daten und wird durch den statistischen Fehler der gemessenen Größe addiert. Betrachten Sie Ihre SRTM auf 90 m. Mit welcher Methode auch immer sie die Höhe messen (Durchschnitt / Maximum / mittlere Rendite), die kleinste Einheit (Pixel), die von ihren Nachbarn unterschieden werden kann, ist 90 m. Wenn Sie den Wert auf 30 m ändern, sagen Sie jetzt, dass alle 9 der resultierenden Pixel dieselbe Höhe haben, obwohl in Wahrheit vielleicht nur einer (oder keiner!) Der Mittelpunkt oder der obere linke ist. Oder Sie interpolieren zwischen Pixeln und erzeugen Werte, die vorher nicht vorhanden waren, was zu einer falschen Genauigkeit führt. Und ja, Wertebereich spielt mit dem möglichen Fehler.
Chris W
Nur als Randnotiz ist es möglich, bestimmte Merkmale in speziellen Fällen zu interpolieren, in denen das Muster klar begrenzt ist. Ein nicht geografisches Merkmal, das in den Sinn kommt, ist die Rekonstruktion von Kennzeicheninformationen aus Fotografien, deren Auflösung für das Lesen zu niedrig ist. Aber Sie müssen wissen, worauf Sie schauen. Ich erinnere mich an einige Fälle, in denen die Rekonstruktion des Kennzeichens fehlgeschlagen ist, weil das betreffende Kennzeichen in einer außereuropäischen Schrift wie Arabisch geschrieben war.
Steve Barnes
Was ist mit Rastern mit bogenbasierter Auflösung? Haben sie keine Rasterzellen, die in verschiedenen Bereichen unterschiedliche Bereiche / Seitenverhältnisse aufweisen können?
CMCDragonkai
@ CMCDragonkai Ich bin mir nicht sicher, wie ich das angehen soll, da Sie sich mit der Darstellung von Daten im Vergleich zu Format- und Koordinatensystemen / Projektionen befassen. Ja, der geografische Bereich in einem Raster ist nicht unbedingt so gleichmäßig wie quadratische Pixel (oder Pixel mit anderem Seitenverhältnis). Viele Satellitendaten-Spezifikationen werden Ihnen dies mitteilen (Pixel ist x am Nadir und y am Schwadrand). Es gibt jedoch immer noch Probleme mit dem Resampling - wenn überhaupt, wird das Problem nur noch verschärft. (Und entschuldigen Sie die Verspätung, ich war schon länger nicht mehr bei SE.)
Chris W