Ich bin sehr neu in der räumlichen Statistik und schaue mir viele Tutorials an.
Aber ich verstehe nicht wirklich, warum Sie ein Variogrammmodell bereitstellen müssen, wenn Sie krige.
Ich verwende das gstat-Paket in R, und dies ist das Beispiel, das sie geben:
library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)
Kann jemand in ein paar Zeilen erklären, warum Sie zuerst vgm liefern müssen? Und wie stellen Sie die Parameter ein?
Vielen Dank im Voraus! Kasper
gstat
R-Paket mit denselben Maissdaten.krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)
schätzt lokale Variogramme. Sie haben beispielsweise kein Variogramm über den gesamten Studienraum, sondern schätzen ein neues Modell für jeden Ort, den Sie vorhersagen möchten. Das lokale Modell erfasst dann nur die nächsten 10 Werte (da Sie keinen maximalen Abstand angeben, sollte es immer 10 Werte erfassen und dahernmin
überflüssig sein).Antworten:
Einführung und Zusammenfassung
Toblers Gesetz der Geographie behauptet
Kriging nimmt ein Modell jener Beziehungen an, in denen
"Dinge" sind numerische Werte an Orten auf der Erdoberfläche (oder im Weltraum), die normalerweise als euklidische Ebene dargestellt werden.
Es wird angenommen, dass diese numerischen Werte Realisierungen von Zufallsvariablen sind.
"Verwandt" wird als Mittelwert und Kovarianz dieser Zufallsvariablen ausgedrückt.
(Eine Sammlung von Zufallsvariablen, die mit Punkten im Raum verknüpft sind, wird als "stochastischer Prozess" bezeichnet.) Das Variogramm enthält die Informationen, die zur Berechnung dieser Kovarianzen erforderlich sind.
Was Kriging ist
Kriging ist speziell die Vorhersage von Dingen an Orten, an denen sie nicht beobachtet wurden. Um den Vorhersageprozess mathematisch nachvollziehbar zu machen, begrenzt Kriging die möglichen Formeln auf lineare Funktionen der beobachteten Werte. Das macht das Problem zu einem endlichen Problem bei der Bestimmung der Koeffizienten. Diese können gefunden werden, indem verlangt wird, dass das Vorhersageverfahren bestimmte Eigenschaften aufweist. Intuitiv ist eine hervorragende Eigenschaft, dass die Unterschiede zwischen dem Prädiktor und dem wahren (aber unbekannten) Wert tendenziell gering sein sollten: Das heißt, der Prädiktor sollte präzise sein . Eine andere Eigenschaft, die stark angepriesen wird, aber fragwürdiger ist, ist, dass der Prädiktor im Durchschnitt dem wahren Wert entsprechen sollte: Er sollte genau sein .
(Der Grund, warum das Bestehen auf perfekter Genauigkeit fraglich ist - aber nicht unbedingt schlecht - ist, dass es normalerweise jedes statistische Verfahren weniger präzise macht, dh variabler. Wenn Sie auf ein Ziel schießen, möchten Sie die Treffer lieber gleichmäßig auf das Ziel verteilen Rand und trifft selten auf die Mitte oder würden Sie Ergebnisse akzeptieren, die direkt neben, aber nicht genau auf die Mitte fokussiert sind? Ersteres ist genau, aber ungenau, während letzteres ungenau, aber präzise ist.)
Diese Annahmen und Kriterien - das heißt, Mittelwerte und Kovarianzen sind geeignete Methoden zur Quantifizierung der Verwandtschaft, dass eine lineare Vorhersage funktioniert und dass der Prädiktor so genau wie möglich sein sollte, sofern er vollkommen genau ist - führen zu einem Gleichungssystem mit a einzigartige Lösung, vorausgesetzt, die Kovarianzen wurden konsistent spezifiziert . Der resultierende Prädiktor wird dabei als "BLUP" bezeichnet: Bester linearer unverzerrter Prädiktor.
Woher kommt das Variogramm?
Um diese Gleichungen zu finden, muss das gerade beschriebene Programm operationalisiert werden. Dies geschieht durch Aufschreiben der Kovarianzen zwischen dem Prädiktor und den Beobachtungen , die als Zufallsvariablen betrachtet werden. Die Algebra der Kovarianzen bewirkt, dass die Kovarianzen unter den beobachteten Werten auch in die Kriging-Gleichungen eingehen.
An diesem Punkt erreichen wir eine Sackgasse, weil diese Kovarianzen fast immer unbekannt sind. Schließlich haben wir in den meisten Anwendungen nur eine Realisierung jeder der Zufallsvariablen beobachtet: nämlich unseren Datensatz, der an jedem einzelnen Ort nur eine Zahl darstellt. Geben Sie das Variogramm ein: Diese mathematische Funktion gibt an, wie die Kovarianz zwischen zwei beliebigen Werten sein soll. Es muss sichergestellt werden, dass diese Kovarianzen "konsistent" sind (in dem Sinne, dass es niemals eine Reihe von Kovarianzen gibt, die mathematisch unmöglich sind: Nicht alle Sammlungen numerischer Maße der "Verwandtschaft" bilden tatsächliche Kovarianzmatrizen ). Deshalb ist ein Variogramm für Kriging unerlässlich.
Verweise
Da die unmittelbare Frage beantwortet wurde, werde ich hier aufhören. Interessierte Leser können anhand guter Texte wie Journel & Huijbregts ' Mining Geostatistics (1978) oder Isaaks & Srivastavas Applied Geostatistics (1989) lernen, wie Variogramme geschätzt und interpretiert werden . (Beachten Sie, dass der Schätzprozess zwei Objekte einführt, die als "Variogramme" bezeichnet werden: ein aus Daten abgeleitetes empirisches Variogramm und ein daran angepasstes Modellvariogramm . Alle Verweise auf "Variogramm" in dieser Antwort beziehen sich auf das Modell. Der Aufruf
vgm
in der Frage gibt eine Computerdarstellung eines Modellvariogramms zurück.) Für einen moderneren Ansatz, bei dem Variogrammschätzung und Kriging angemessen kombiniert werden, siehe Diggle &Modellbasierte Geostatistik (2007) (die auch ein erweitertes Handbuch für dieR
PaketeGeoR
und istGeoRglm
).Bemerkungen
Unabhängig davon, ob Sie Kriging für die Vorhersage oder einen anderen Algorithmus verwenden, ist die quantitative Charakterisierung der Verwandtschaft, die das Variogramm bietet, nützlich, um jedes Vorhersageverfahren zu bewerten . Beachten Sie, dass alle räumlichen Interpolationsmethoden unter diesem Gesichtspunkt Prädiktoren sind - und viele von ihnen sind lineare Prädiktoren, wie z. B. IDW (Inverse Distance Weighted). Das Variogramm kann verwendet werden, um den Durchschnittswert und die Streuung (Standardabweichung) einer der Interpolationsmethoden zu bewerten. Somit ist es weit über seine Verwendung in Kriging hinaus anwendbar.
quelle