Wie erstelle ich eine Fehlerzuordnung, um eine durchschnittliche Kernel-Dichtekarte zu unterstützen?

10

Ich habe eine durchschnittliche Kerneldichtekarte erstellt, indem ich KDEs für Punkte ausgeführt habe, die in derselben räumlichen Ausdehnung gestapelt sind. Angenommen, wir haben drei Punkt-Shapefiles, die Sämlinge in drei verschiedenen Waldlücken derselben Form und Größe darstellen. Ich habe für jedes Punkt-Shapefile eine KDE ausgeführt. Die Ausgabe des KDE wurde dann basierend auf der räumlichen Ausdehnung gestapelt, um den Durchschnitt im Rasterrechner von Arc zu berechnen, zum Beispiel : Float(("KDE1"+"KDE2"+"KDE3")/3). Hier ist das Endprodukt:

Geben Sie hier die Bildbeschreibung ein

Jetzt bin ich daran interessiert, eine Karte zu erstellen, die den Fehler darstellt, der mit den gemittelten KDEs verbunden ist. Ich hoffe, die Fehlerkarte verwenden zu können, um visuell darzustellen, wie viel Fehler mit den Hotspots verbunden ist (z. B. liegt der SW-Hotspot ausschließlich an den Punkten in einer Lücke?). Wie soll ich eine Karte des Fehlers erstellen, der mit den gemittelten KDEs verbunden ist? Wäre MSE in diesem Fall das am besten geeignete Fehlermaß?

Aaron
quelle
3
Es ist eine sehr interessante Analyse. Was meinst du mit "Standardfehler"? Eine Art Abweichung (Differenz) jeder Dichtekarte von der "mittleren" Schicht?
Landschaftsanalyse
@Landscape Analysis Post bearbeitet, um Kommentare zu adressieren. Ja, ich denke, dass eine MSE-Schätzung in diesem Fall am besten geeignet ist. Im Wesentlichen wird gezeigt, wie jede KDE von der durchschnittlichen KDE abweicht. Ich bin mir nicht sicher, wie ich das alles mit ArcGIS und / oder Skripten zusammenstellen soll.
Aaron

Antworten:

8

Eine Einschränkung

Ein Standardfehler ist eine nützliche Methode, um eine Unsicherheit aus den abgetasteten Daten abzuschätzen, wenn die Daten keinen systematischen Fehler enthalten. Diese Annahme ist in diesem Zusammenhang von zweifelhafter Gültigkeit, da (a) die KDE-Karten lokal bestimmte Fehler aufweisen, die systematisch zwischen den Schichten bestehen können, und (b) eine potenziell große Unsicherheitskomponente aufgrund der Wahl des Kernelradius (oder der "Bandbreite") ") wird in keiner Sammlung dieser Karten wiedergegeben.

Einige Möglichkeiten

Trotzdem ist es eine gute Idee, die Variabilität zwischen einer Sammlung verwandter, zusammengestellter ("gestapelter") Karten darzustellen - vorausgesetzt, Sie erinnern sich an die gerade beschriebenen Einschränkungen. In diesem Umfeld wären verschiedene Maße für die lokale Variabilität selbstverständlich, darunter:

  • Der Wertebereich , entweder additiv (Maximum minus Minimum) oder multiplikativ (Maximum geteilt durch Minimum) ausgedrückt .

  • Die Varianz oder Standardabweichung von Werten. Die multiplikative Version davon wäre die Varianz oder Standardabweichung der Logarithmen der Werte.

  • Ein robuster Dispersionsschätzer wie der Interquartilbereich (oder das Verhältnis des dritten zum ersten Quartil).

In vielerlei Hinsicht können die multiplikativen Maße für Dichten besser geeignet sein, da der Unterschied zwischen (sagen wir) 100 und 101 Bäumen pro Morgen unwichtig sein kann, während der Unterschied zwischen 2 und 1 Bäumen pro Morgen relativ wichtig sein könnte. Beide weisen den gleichen (additiven) Bereich von 101 - 100 = 2 - 1 = 1 auf, aber ihre multiplikativen Bereiche von 1,01 und 2,00 unterscheiden sich erheblich. (Beachten Sie, dass ein multiplikativer Bereich immer 1 überschreitet, sodass 2,00 hundertmal weiter von 1 entfernt ist als 1,01.)

Berechnung

Die Berechnung dieser Maßnahmen erfordert eine Form lokaler Statistiken. Die Zellstatistikfunktion in Spatial Analyst berechnet die Abweichungen, Bereiche und Standardabweichungen. Die lokalen Quantile können mit Rang gefunden werden . Anstatt pingelig zu sein, welche Ränge verwendet werden sollen, wählen Sie geeignete in der Nähe der Quartile aus. Um sie zu finden, sei n die Anzahl der Gitter im Stapel. Der Median hat einen Rang von (n + 1) / 2 - was möglicherweise keine ganze Zahl ist, was darauf hinweist, dass er durch Mitteln der Ränge n / 2 und n / 2 + 1 berechnet werden sollte, von denen jeder den Median annähern würde. Um die Quartile zu approximieren, runden Sie (n + 1) / 2 auf die nächste ganze Zahl ab, addieren Sie dann erneut 1 und dividieren Sie durch 2. Diese Zahl sei r . Benutzenr und n + 1 - r für die Reihen der Quartile.

Wenn der Stapel beispielsweise n = 6 Gitter hat, ist (n + 1) / 2 abgerundet 3 und (3 + 1) / 2 = 2 muss nicht gerundet werden. Verwenden Sie r = 2 und r = 6 + 1 - 2 = 5 für die Ränge. Tatsächlich würde diese Prozedur den zweitniedrigsten ( r = 2) und zweithöchsten ( r = 5) Wert der sechs Werte in jeder Zelle zurückgeben. Sie können entweder ihre Differenz oder ihr Verhältnis abbilden.

whuber
quelle
2
Ich würde mir vorstellen, dass der Variationskoeffizient in diesem Zusammenhang nützlich wäre.
Jeffrey Evans
1
@ Jeffrey Danke, das ist auch eine Überlegung. Der CV wird erhalten, indem das (lokale) Standardabweichungsgitter durch das (lokale) mittlere Gitter geteilt wird. Ich habe es nicht erwähnt, aber für solche multiplikativen Zusammenfassungen sollte sorgfältig darauf geachtet werden, Bereiche auszublenden, in denen der Nenner (der Mittelwert oder das Minimum) nahe Null liegt: Die Ergebnisse können dort unzuverlässig und wahrscheinlich sein wird nichts anderes als numerische Ungenauigkeit und winzige Ungenauigkeiten bei der Annäherung der Kernel widerspiegeln.
whuber
@whuber, könnten Sie in Ihrem ersten Absatz auf (a) näher eingehen? Beziehen Sie sich beispielsweise auf Fehler in Datenerfassungstechniken, die über jede Waldlücke hinweg bestehen können (und sich daher systematisch in jedem KDE-Raster manifestieren), oder auf Fehler, die mit der Implementierung der Fokusfunktion verbunden sind?
MannyG
@whuber Tolle tolle Ideen - vielen Dank!
Aaron