Mindestanzahl von Abtastwerten für die Kriging-Interpolation

19

Ich erhalte einige Daten mit der Anzahl der Proben mit der Aufforderung, sie mit der Kriging-Methode zu interpolieren.
Nach einigen Untersuchungen stellte sich heraus, dass Kriging-Ergebnisse (in ArcGIS Geostatistical Analyst mit Standardparametern durchgeführt) nicht zufriedenstellend sind. Die interpolierten Werte unterscheiden sich stark von den Messungen (insbesondere von den oberen), und die Oberfläche sieht nicht zuverlässig aus. Hier ist das Bild: Bildbeschreibung hier eingeben
Ich nehme an, dass das Hauptproblem die unzureichende Anzahl von Proben ist.

Wie viele Punkte sollten wir verwenden, um verlässliche Ergebnisse zu erzielen?
Oder ist die Kriging-Methode für so unterschiedliche Werte nicht geeignet?

Marcin
quelle
Sie sagten, dass "obwohl die Menschen erfolgreich nur sieben Datenpunkte krigten (in einer Monographie von Robert Jernigan, die in den späten 1980er Jahren von der US EPA veröffentlicht wurde), ...". Aber ich kann diesen Artikel nicht finden. Können Sie eine offene Adresse für diesen Artikel angeben? Vielen Dank ...
26.

Antworten:

30

Wenn Sie "Standardwerte" verwenden, wenden Sie nur den Kriging-Algorithmus an, der, wie Sie festgestellt haben, bei Verwendung dieser Daten mangelhaft ist.

(Ich werde kurz auf eine Seifenkiste zurückgreifen. Meiner Meinung nach besteht der schnellste Weg, mit einem Computerprogramm schlechte Ergebnisse zu erzielen, darin, die Standardparameter zu akzeptieren. ArcGIS ist eine der umfangreichsten und leistungsfähigsten Umgebungen, um in diesem Fall schlechte Ergebnisse zu erzielen Art und Weise. die Moral ist Software nicht für wichtige Arbeit verwenden , bis Sie wissen , wie es zu kontrollieren. Hinunter vom soapbox jetzt ...)

Damit Kriging funktioniert, müssen Sie eine intensive statistische Voranalyse der als "Variographie" bezeichneten Daten durchführen. Wie gut dies letztendlich funktioniert, hängt von den Daten sowie Ihren geostatistischen Fähigkeiten ab. (Es wurden ganze Bücher über Variographie geschrieben, einschließlich der bahnbrechenden Geostatistik des Bergbaus von Journel & Huijbregts und Variowin von Yvan Pannatier.) Obwohl Menschen nur sieben Datenpunkte erfolgreich krigten (in einer Monographie von Robert Jernigan, veröffentlicht von der US EPA in der Ende der 1980er Jahre) und im Prinzip kann man mit nur zwei oder drei Punkten (ich habe dies getan, um den Algorithmus zu demonstrieren ) krige, Faustregeln in der Literatur reichen von einem Minimum von 20 Punkten bis 100 Punkten und dem Konsens scheint um die 30 Punkte zu sein.

In Ihrem Fall haben Sie - obwohl Sie die Daten nicht beschreiben - einige eindeutige Probleme, einschließlich einer stark verzerrten Verteilung und eines deutlichen Mangels an Nachweisen für die Stationarität. Diese erfordern eine spezielle statistische Behandlung oder spezielle Formen des Krigings (z. B. ein räumliches verallgemeinertes lineares Modell). Sie werden keine guten Ergebnisse erzielen, wenn Sie solche Daten kriggen, bis Sie eine sehr große Datenmenge haben.

Die Legende schlägt vor , Sie erstellen könnten versuchen , Dichte eher Gitter als tatsächlich interpolieren Daten: obwohl die Ausgänge der beiden Verfahren gleich aussehen können, tun sie deutlich unterschiedliche Dinge und haben deutlich unterschiedliche Interpretationen. Sie interpolieren, wenn die Daten als Stichproben von einer hypothetischen zusammenhängenden Oberfläche betrachtet werden. Die Interpolation sagt die nicht abgetasteten Werte voraus. Standardbeispiele sind Höhenmessungen (die die Erdoberfläche abtasten) und Temperaturmessungen (die ein "Temperaturfeld" abtasten). Sie berechnen eine Dichte, wenn Sie vollständige Informationen über die Menge habenvon etwas und Sie möchten eine geglättete Version dieses Betrags pro Flächeneinheit darstellen. (Im Gegensatz zur Interpolation gibt es keine nicht abzutastenden Werte, die vorhergesagt werden könnten.) Das Standardbeispiel ist eine Bevölkerungsdichte: Die Daten sind Zählungen aller Personen innerhalb eines Gebiets. Die Ausgabe ist eine Karte der Bevölkerungsdichte.

whuber
quelle
6
Tolle Antwort @whuber. Hängt die minimale Anzahl von Punkten jedoch nicht auch teilweise von der Ausdehnung des räumlichen Bereichs und der gewünschten Körnung der Vorhersage ab? Wenn Sie es auf ein Stichprobenproblem reduzieren, wird es zu einer Frage der Erfassung der Population und der räumlichen Variation in der Stichprobe.
Jeffrey Evans
@ Jeffrey Das ist teilweise der Fall. Die Datenmenge hängt von zwei Faktoren ab: der Varianz der Kriging-Vorhersage (die über den räumlichen Bereich variiert) und der Genauigkeit, mit der das Variogramm selbst geschätzt werden kann. Letzteres wird oft übersehen, besonders bei traditionellen Kriging-Behandlungen: Es ist eine Art Elefant im Raum. Wenn Sie wissen , die richtige Variogramms und es hat ein kleines Nugget / Schweller - Verhältnis und große Reichweite in Bezug auf das Ausmaß der räumlichen Domäne, können Sie mit bemerkenswert wenige Daten Krige, vor allem , wenn sie ausreichend das gesamte Spektrum der Datenwerte abzutasten.
Whuber
3
Ich bin davon überzeugt, dass jeder, der Kriging verwendet, entweder einen guten Geostatistikkurs oder einen soliden GIS / Statistik-Hintergrund benötigen sollte. Das richtige Modellieren eines Semivariogramms erfordert etwas Geschick.
Mike T
1
Die Faustregel, die mir beigebracht wurde: 30 Punkte für omnidirektionales Kriging und 100 Punkte für bidirektionales Kriging.
Jareks
1

Es gibt zwei getrennte Fragen: erstens die Anzahl der Datenstellen, die zum Schätzen / Modellieren des Variogramms verwendet werden sollen, und zweitens die Anzahl der Datenstellen, die in den Kriging-Gleichungen zum Interpolieren des Werts an einer Nichtdatenstelle (oder zum Schätzen des Durchschnittswerts) verwendet werden sollen über eine Region). Angenommen, Sie verwenden eine sich bewegende Suchumgebung, verschlechtern mehr als 15-20 Datenpositionen in der Umgebung wahrscheinlich die Ergebnisse, da (1) nur die nächsten Datenpositionen in der Suchumgebung eine Gewichtung ungleich Null aufweisen, (2) mehr Daten enthalten Stellen die Größe der zu invertierenden Matrix größer ist und die Möglichkeit einer schlecht konditionierten Matrix zunimmt. Die Gesamtzahl der für das Kriging benötigten Datenorte hängt von der Anzahl der zu interpolierenden Orte und den räumlichen Mustern dieser Punkte sowie von den Datenorten ab. Zusamenfassend,

Bei der Schätzung / Modellierung des Variogramms handelt es sich beispielsweise um ein ganz anderes Problem

1991, Myers, DE, On Variogram Estimation in Proceedings of the First Inter. Conf. Stat. Comp., Cesme, Türkei,

30. März bis 2. April 1987, Band II, American Sciences Press, 261-281

1987, A. Warrick und DE Myers, Optimierung von Probenahmestellen für Variogrammberechnungen Water Resources Research 23, 496-500

Diese können unter www.u.arizona.edu/~donaldm heruntergeladen werden

Donald Myers
quelle