Ich erhalte einige Daten mit der Anzahl der Proben mit der Aufforderung, sie mit der Kriging-Methode zu interpolieren.
Nach einigen Untersuchungen stellte sich heraus, dass Kriging-Ergebnisse (in ArcGIS Geostatistical Analyst mit Standardparametern durchgeführt) nicht zufriedenstellend sind. Die interpolierten Werte unterscheiden sich stark von den Messungen (insbesondere von den oberen), und die Oberfläche sieht nicht zuverlässig aus. Hier ist das Bild:
Ich nehme an, dass das Hauptproblem die unzureichende Anzahl von Proben ist.
Wie viele Punkte sollten wir verwenden, um verlässliche Ergebnisse zu erzielen?
Oder ist die Kriging-Methode für so unterschiedliche Werte nicht geeignet?
Antworten:
Wenn Sie "Standardwerte" verwenden, wenden Sie nur den Kriging-Algorithmus an, der, wie Sie festgestellt haben, bei Verwendung dieser Daten mangelhaft ist.
(Ich werde kurz auf eine Seifenkiste zurückgreifen. Meiner Meinung nach besteht der schnellste Weg, mit einem Computerprogramm schlechte Ergebnisse zu erzielen, darin, die Standardparameter zu akzeptieren. ArcGIS ist eine der umfangreichsten und leistungsfähigsten Umgebungen, um in diesem Fall schlechte Ergebnisse zu erzielen Art und Weise. die Moral ist Software nicht für wichtige Arbeit verwenden , bis Sie wissen , wie es zu kontrollieren. Hinunter vom soapbox jetzt ...)
Damit Kriging funktioniert, müssen Sie eine intensive statistische Voranalyse der als "Variographie" bezeichneten Daten durchführen. Wie gut dies letztendlich funktioniert, hängt von den Daten sowie Ihren geostatistischen Fähigkeiten ab. (Es wurden ganze Bücher über Variographie geschrieben, einschließlich der bahnbrechenden Geostatistik des Bergbaus von Journel & Huijbregts und Variowin von Yvan Pannatier.) Obwohl Menschen nur sieben Datenpunkte erfolgreich krigten (in einer Monographie von Robert Jernigan, veröffentlicht von der US EPA in der Ende der 1980er Jahre) und im Prinzip kann man mit nur zwei oder drei Punkten (ich habe dies getan, um den Algorithmus zu demonstrieren ) krige, Faustregeln in der Literatur reichen von einem Minimum von 20 Punkten bis 100 Punkten und dem Konsens scheint um die 30 Punkte zu sein.
In Ihrem Fall haben Sie - obwohl Sie die Daten nicht beschreiben - einige eindeutige Probleme, einschließlich einer stark verzerrten Verteilung und eines deutlichen Mangels an Nachweisen für die Stationarität. Diese erfordern eine spezielle statistische Behandlung oder spezielle Formen des Krigings (z. B. ein räumliches verallgemeinertes lineares Modell). Sie werden keine guten Ergebnisse erzielen, wenn Sie solche Daten kriggen, bis Sie eine sehr große Datenmenge haben.
Die Legende schlägt vor , Sie erstellen könnten versuchen , Dichte eher Gitter als tatsächlich interpolieren Daten: obwohl die Ausgänge der beiden Verfahren gleich aussehen können, tun sie deutlich unterschiedliche Dinge und haben deutlich unterschiedliche Interpretationen. Sie interpolieren, wenn die Daten als Stichproben von einer hypothetischen zusammenhängenden Oberfläche betrachtet werden. Die Interpolation sagt die nicht abgetasteten Werte voraus. Standardbeispiele sind Höhenmessungen (die die Erdoberfläche abtasten) und Temperaturmessungen (die ein "Temperaturfeld" abtasten). Sie berechnen eine Dichte, wenn Sie vollständige Informationen über die Menge habenvon etwas und Sie möchten eine geglättete Version dieses Betrags pro Flächeneinheit darstellen. (Im Gegensatz zur Interpolation gibt es keine nicht abzutastenden Werte, die vorhergesagt werden könnten.) Das Standardbeispiel ist eine Bevölkerungsdichte: Die Daten sind Zählungen aller Personen innerhalb eines Gebiets. Die Ausgabe ist eine Karte der Bevölkerungsdichte.
quelle
Es gibt zwei getrennte Fragen: erstens die Anzahl der Datenstellen, die zum Schätzen / Modellieren des Variogramms verwendet werden sollen, und zweitens die Anzahl der Datenstellen, die in den Kriging-Gleichungen zum Interpolieren des Werts an einer Nichtdatenstelle (oder zum Schätzen des Durchschnittswerts) verwendet werden sollen über eine Region). Angenommen, Sie verwenden eine sich bewegende Suchumgebung, verschlechtern mehr als 15-20 Datenpositionen in der Umgebung wahrscheinlich die Ergebnisse, da (1) nur die nächsten Datenpositionen in der Suchumgebung eine Gewichtung ungleich Null aufweisen, (2) mehr Daten enthalten Stellen die Größe der zu invertierenden Matrix größer ist und die Möglichkeit einer schlecht konditionierten Matrix zunimmt. Die Gesamtzahl der für das Kriging benötigten Datenorte hängt von der Anzahl der zu interpolierenden Orte und den räumlichen Mustern dieser Punkte sowie von den Datenorten ab. Zusamenfassend,
Bei der Schätzung / Modellierung des Variogramms handelt es sich beispielsweise um ein ganz anderes Problem
1991, Myers, DE, On Variogram Estimation in Proceedings of the First Inter. Conf. Stat. Comp., Cesme, Türkei,
30. März bis 2. April 1987, Band II, American Sciences Press, 261-281
1987, A. Warrick und DE Myers, Optimierung von Probenahmestellen für Variogrammberechnungen Water Resources Research 23, 496-500
Diese können unter www.u.arizona.edu/~donaldm heruntergeladen werden
quelle