Warum müssen Sie beim Kriging ein Variogrammmodell bereitstellen?

9

Ich bin sehr neu in der räumlichen Statistik und schaue mir viele Tutorials an.

Aber ich verstehe nicht wirklich, warum Sie ein Variogrammmodell bereitstellen müssen, wenn Sie krige.

Ich verwende das gstat-Paket in R, und dies ist das Beispiel, das sie geben:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

Kann jemand in ein paar Zeilen erklären, warum Sie zuerst vgm liefern müssen? Und wie stellen Sie die Parameter ein?

Vielen Dank im Voraus! Kasper

Kasper
quelle
Für einfaches Kriging ist der Schätzer nur dann BLAU, wenn der Mittelwert und die räumliche Kovarianz im Voraus bekannt sind. Beim gewöhnlichen Kriging schätzt man das Variogramm aus den Daten und führt dann die Interpolation durch. Siehe die Vignette aus dem gstatR-Paket mit denselben Maissdaten.
Andy W
Hey Andy, danke für deinen Kommentar. Ich habe in der Vignette herausgefunden, dass man auch ohne Variogrammmodell krige kann. Ich habe folgendes gemacht: krige (Residuen ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), also krige mit nur 5 Nachbarn und maximal 10 Nachbarn. Ist das überhaupt sinnvoll? Das Ergebnis war irgendwie nett: dropbox.com/s/7lxvfiyfl7ekhb4/…
Kasper
Ich glaube, ich habe ein Problem mit der Modellierung des Variogramms: Was ist, wenn Sie annehmen, dass die Korrelation nichts mit der Entfernung zu tun hat, sondern mit den nächsten Nachbarn?
Kasper
"Was ist, wenn Sie annehmen, dass die Korrelation nichts mit der Entfernung zu tun hat, sondern mit den nächsten Nachbarn?" - das ist dann nicht kriging, es ist mehr im Einklang mit knn Klassifizierung. Der Code krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)schätzt lokale Variogramme. Sie haben beispielsweise kein Variogramm über den gesamten Studienraum, sondern schätzen ein neues Modell für jeden Ort, den Sie vorhersagen möchten. Das lokale Modell erfasst dann nur die nächsten 10 Werte (da Sie keinen maximalen Abstand angeben, sollte es immer 10 Werte erfassen und daher nminüberflüssig sein).
Andy W
1
Dann ist es logisch, lokale Variogramme zu schätzen. Wenn sie je nach bestimmten Merkmalen variieren, einschließlich anderer Prädiktoren im Modell, ist dies ebenfalls eine Option. IDW kann als die einfachste Art von Kriging-Modell angesehen werden - daher sollte IDW nicht besser sein, als das Variogramm tatsächlich aus den Daten zu schätzen.
Andy W

Antworten:

9

Einführung und Zusammenfassung

Toblers Gesetz der Geographie behauptet

Alles hängt mit allem anderen zusammen, aber nahe Dinge sind mehr verwandt als entfernte Dinge.

Kriging nimmt ein Modell jener Beziehungen an, in denen

  • "Dinge" sind numerische Werte an Orten auf der Erdoberfläche (oder im Weltraum), die normalerweise als euklidische Ebene dargestellt werden.

  • Es wird angenommen, dass diese numerischen Werte Realisierungen von Zufallsvariablen sind.

  • "Verwandt" wird als Mittelwert und Kovarianz dieser Zufallsvariablen ausgedrückt.

(Eine Sammlung von Zufallsvariablen, die mit Punkten im Raum verknüpft sind, wird als "stochastischer Prozess" bezeichnet.) Das Variogramm enthält die Informationen, die zur Berechnung dieser Kovarianzen erforderlich sind.

Was Kriging ist

Kriging ist speziell die Vorhersage von Dingen an Orten, an denen sie nicht beobachtet wurden. Um den Vorhersageprozess mathematisch nachvollziehbar zu machen, begrenzt Kriging die möglichen Formeln auf lineare Funktionen der beobachteten Werte. Das macht das Problem zu einem endlichen Problem bei der Bestimmung der Koeffizienten. Diese können gefunden werden, indem verlangt wird, dass das Vorhersageverfahren bestimmte Eigenschaften aufweist. Intuitiv ist eine hervorragende Eigenschaft, dass die Unterschiede zwischen dem Prädiktor und dem wahren (aber unbekannten) Wert tendenziell gering sein sollten: Das heißt, der Prädiktor sollte präzise sein . Eine andere Eigenschaft, die stark angepriesen wird, aber fragwürdiger ist, ist, dass der Prädiktor im Durchschnitt dem wahren Wert entsprechen sollte: Er sollte genau sein .

(Der Grund, warum das Bestehen auf perfekter Genauigkeit fraglich ist - aber nicht unbedingt schlecht - ist, dass es normalerweise jedes statistische Verfahren weniger präzise macht, dh variabler. Wenn Sie auf ein Ziel schießen, möchten Sie die Treffer lieber gleichmäßig auf das Ziel verteilen Rand und trifft selten auf die Mitte oder würden Sie Ergebnisse akzeptieren, die direkt neben, aber nicht genau auf die Mitte fokussiert sind? Ersteres ist genau, aber ungenau, während letzteres ungenau, aber präzise ist.)

Diese Annahmen und Kriterien - das heißt, Mittelwerte und Kovarianzen sind geeignete Methoden zur Quantifizierung der Verwandtschaft, dass eine lineare Vorhersage funktioniert und dass der Prädiktor so genau wie möglich sein sollte, sofern er vollkommen genau ist - führen zu einem Gleichungssystem mit a einzigartige Lösung, vorausgesetzt, die Kovarianzen wurden konsistent spezifiziert . Der resultierende Prädiktor wird dabei als "BLUP" bezeichnet: Bester linearer unverzerrter Prädiktor.

Woher kommt das Variogramm?

Um diese Gleichungen zu finden, muss das gerade beschriebene Programm operationalisiert werden. Dies geschieht durch Aufschreiben der Kovarianzen zwischen dem Prädiktor und den Beobachtungen , die als Zufallsvariablen betrachtet werden. Die Algebra der Kovarianzen bewirkt, dass die Kovarianzen unter den beobachteten Werten auch in die Kriging-Gleichungen eingehen.

An diesem Punkt erreichen wir eine Sackgasse, weil diese Kovarianzen fast immer unbekannt sind. Schließlich haben wir in den meisten Anwendungen nur eine Realisierung jeder der Zufallsvariablen beobachtet: nämlich unseren Datensatz, der an jedem einzelnen Ort nur eine Zahl darstellt. Geben Sie das Variogramm ein: Diese mathematische Funktion gibt an, wie die Kovarianz zwischen zwei beliebigen Werten sein soll. Es muss sichergestellt werden, dass diese Kovarianzen "konsistent" sind (in dem Sinne, dass es niemals eine Reihe von Kovarianzen gibt, die mathematisch unmöglich sind: Nicht alle Sammlungen numerischer Maße der "Verwandtschaft" bilden tatsächliche Kovarianzmatrizen ). Deshalb ist ein Variogramm für Kriging unerlässlich.

Verweise

Da die unmittelbare Frage beantwortet wurde, werde ich hier aufhören. Interessierte Leser können anhand guter Texte wie Journel & Huijbregts ' Mining Geostatistics (1978) oder Isaaks & Srivastavas Applied Geostatistics (1989) lernen, wie Variogramme geschätzt und interpretiert werden . (Beachten Sie, dass der Schätzprozess zwei Objekte einführt, die als "Variogramme" bezeichnet werden: ein aus Daten abgeleitetes empirisches Variogramm und ein daran angepasstes Modellvariogramm . Alle Verweise auf "Variogramm" in dieser Antwort beziehen sich auf das Modell. Der Aufruf vgmin der Frage gibt eine Computerdarstellung eines Modellvariogramms zurück.) Für einen moderneren Ansatz, bei dem Variogrammschätzung und Kriging angemessen kombiniert werden, siehe Diggle &Modellbasierte Geostatistik (2007) (die auch ein erweitertes Handbuch für die RPakete GeoRund ist GeoRglm).


Bemerkungen

Unabhängig davon, ob Sie Kriging für die Vorhersage oder einen anderen Algorithmus verwenden, ist die quantitative Charakterisierung der Verwandtschaft, die das Variogramm bietet, nützlich, um jedes Vorhersageverfahren zu bewerten . Beachten Sie, dass alle räumlichen Interpolationsmethoden unter diesem Gesichtspunkt Prädiktoren sind - und viele von ihnen sind lineare Prädiktoren, wie z. B. IDW (Inverse Distance Weighted). Das Variogramm kann verwendet werden, um den Durchschnittswert und die Streuung (Standardabweichung) einer der Interpolationsmethoden zu bewerten. Somit ist es weit über seine Verwendung in Kriging hinaus anwendbar.

whuber
quelle
Vielen Dank für diese ausführliche Antwort. Ich stelle die gleiche Frage wie oben: Was ist, wenn ich nicht davon ausgehen kann, dass die räumliche Korrelation unabhängig vom Ort ist? Ist es richtig, dass die Modellierung des Variogramms dann nicht sinnvoll ist, da ich für alle Standorte ein Modell des Variogramms erstellen müsste? Ist es dann besser, IDW zu verwenden?
Kasper
Wenn Sie keine Stationarität zweiter Ordnung des Prozesses annehmen können, umfassen verschiedene Optionen: (1) Sammeln mehrerer Realisierungen des Prozesses (wenn dieser mit der Zeit variiert); (2) Schätzen von Variogrammen über lokale Teilregionen (wenn viele Daten vorliegen); und (3) Annahme eines parametrischen Modells dafür, wie sich das Variogramm mit der Position ändert (wie in GARCH-Modellen für 1D-Prozesse). Meine letzten Kommentare befassen sich direkt mit der Unempfehlbarkeit, auf etwas wie IDW zurückzugreifen: Ob Sie das Variogramm schätzen können oder nicht , im Prinzip existiert es und daher ist IDW normalerweise nicht optimal.
whuber