Bestimmen statistischer Beziehungen zwischen Rastern mit R vs ArcGIS Desktop?

8

Ich versuche mithilfe statistischer Techniken zu analysieren, wie sich Rastersätze zueinander verhalten. Da ich nicht viel Erfahrung mit den räumlichen Statistik-Tools in ArcGIS habe, habe ich meine Raster als Ascii- Dateien exportiert und sie mit R (insbesondere dem maptoolsPaket und readAsciiGrid()) analysiert . Dies hat in Ordnung funktioniert (aber da die Datasets 90.000 Punkte haben, wird die Analyse nur langsam ausgeführt), aber ich weiß nicht, ob ich in R vorhandene Funktionen in ArcGIS neu erstelle .

Zum Beispiel möchte ich Regressionen zwischen jedem dieser Raster mit einigen verschiedenen Transformationen (logarithmisch, exponentiell usw.) durchführen. Kann dies in ArcGIS durchgeführt werden ? Eine zweite umfassendere Frage ist, ob es statistische Standardmethoden zur Untersuchung dieser Art von Daten gibt.

Jedes Rasterpaar hat übereinstimmende Daten- / Nichtdatenwerte und alle Parameter sind bis auf den Gitterzellenwert identisch.

djq
quelle

Antworten:

9

Ich würde mich an R halten. Wenn Geschwindigkeit wirklich ein Problem ist (ich bezweifle, dass 90.000 keine so große Zahl sind), könnten Sie versuchen, Beziehungen zwischen einer Teilmenge Ihrer Daten zu finden. Eigentlich würde ich als erstes eine Handlung machen, um nach offensichtlichen Beziehungen zu suchen.

Selbst wenn arcgis Werkzeuge zum Vergleichen von Rastern enthält, bietet R immer viel mehr statistische Werkzeuge.

Z.B:

library(rgdal)
map1<-readGDAL('file.asc')
map2<-readGDAL('file2.asc')
samplenr<-sample(length(map1$band1), 1000)
smallset<-data.frame(map1=map1$band1[samplenr],map2=map2$band1[samplenr])
plot(smallset)
lm(map2~map1, smallset)
...

Ich sollte eigentlich hinzufügen, dass es oft richtiger ist, mit einer Teilmenge Ihrer Daten zu arbeiten als mit Ihrem vollständigen Datensatz. In vielen Fällen sind Gitterzellen nicht unabhängig von den umgebenden Datenzellen, was zu übermäßig optimistischen p-Werten für z. B. Regressionsanpassungen führt (weitere Informationen finden Sie, wenn Sie nach Deklaration suchen).

johanvdw
quelle
2
+1. Weder ArcGIS noch ein GIS werden jemals nativ Funktionen wie R oder andere statistische Pakete mit vollem Funktionsumfang bereitstellen. Es wäre dumm für sie, es zu versuchen. Wir können hoffen - und ArcGIS scheint sich in einem frühen Stadium zu befinden -, dass die GIS-Plattform eine effiziente Integration mit anderen Anwendungen für statistische Analysen und Visualisierungen ermöglicht.
whuber
Es ist wahr - Geschwindigkeit ist nicht wirklich ein Problem. Das Laden von zwei Rastern dauert ungefähr 10 Sekunden und bisher 10-15 Sekunden pro Vorgang. Wenn ich die Dinge im Blick habe, habe ich in ArcGIS genauso lange darauf gewartet, dass etwas passiert! Ich habe vor, mehr Sampling zu verwenden, wodurch geringfügige Verzögerungen vermieden werden.
DJQ
4

Schauen Sie sich das R- Raster-Paket an , das speziell für diese Art von Problem entwickelt wurde. Es versucht, so wenig Raster wie möglich im Speicher zu halten, und führt eine Reihe grundlegender räumlicher Operationen aus. Über GDAL kann es neben vielen anderen Formaten native ESRI-Grid-Dateien verarbeiten. Die Vignette bietet einige schöne Beispiele für ihre Verwendung.

scw
quelle
1

Ich habe gerade über ein ArcGIS 10- Paket gelesen , das ein R-Plugin ist. Ich hatte noch keine Gelegenheit, es vollständig zu erkunden, aber es könnte möglich sein, dies zu ändern, um das zu tun, was ich oben beschrieben habe.

djq
quelle