Verwirrung in Bezug auf Kriging

9

Ich habe diesen Wikipedia-Artikel über Kriging gelesen. Ich habe den Teil nicht verstanden, als er das sagt

Kriging berechnet den besten linearen unverzerrten Schätzer von so dass die Kriging-Varianz von mit der Unvoreingenommenheitsbedingung minimiert wird. Ich habe die Ableitung nicht verstanden und auch nicht, wie die Varianz minimiert wird. Irgendwelche Vorschläge?Z.^(x0)Z.(x0)

Insbesondere habe ich nicht den Teil bekommen, bei dem ein minimiertes Vorbehaltlich einer unvoreingenommenen Bedingung gilt.

Ich denke es hätte sein sollen

E [Z '(x0) -Z (x0)] anstelle von E [Z' (x) -Z (x)], nicht wahr? 'entspricht dem Hut im Wiki-Artikel. Außerdem habe ich nicht verstanden, wie der Kriging-Fehler abgeleitet wird

user31820
quelle
Wo wirst du in der Ableitung aufgehängt?
whuber
Der Teil, in dem der Kriging-Fehler berechnet und die Unvoreingenommenheitsbedingung auferlegt wird. Es ist gut zu sagen, dass eine unvoreingenommene Bedingung bedeutet, dass die Erwartung des Schätzers und die wahre gleich sind. Ich habe den Beitrag so bearbeitet, dass er die Details enthält.
user31820
Ich denke, Sie haben Recht, dass der Wikipedia-Ausdruck lauten sollte . E.[Z.'(x0)- -Z.(x0)]]
whuber

Antworten:

13

Angenommen, ist ein Vektor, von dem angenommen wird, dass er eine multivariate Verteilung des unbekannten Mittelwerts und der bekannten Varianz-Kovarianz-Matrix . Wir beobachten aus dieser Verteilung und möchten z 0 aus diesen Informationen unter Verwendung eines unverzerrten linearen Prädiktors vorhersagen : (μ,μ,,μ)Σ ( z 1 , z 2 , , z n )(Z0,Z1,,Zn)(μ,μ,,μ)Σ(z1,z2,,zn) z0

  • Linear bedeutet, dass die Vorhersage die Form annehmen muss, damit die Koeffizienten λ i bestimmt werden. Diese Koeffizienten können höchstens von dem abhängen, was im Voraus bekannt ist: nämlich den Einträgen von Σ .z0^=λ1z1+λ2z2++λnznλiΣ

Dieser Prädiktor kann auch als Zufallsvariable .Z0^=λ1Z1+λ2Z2++λnZn

  • Unvoreingenommen bedeutet, dass die Erwartung von gleich dem (unbekannten) Mittelwert μ ist .Z0^μ

Das Aufschreiben gibt einige Informationen über die Koeffizienten:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

Die zweite Zeile ist auf die Linearität der Erwartung zurückzuführen, und der Rest ist einfache Algebra. Da angenommen wird, dass dieses Verfahren unabhängig vom Wert von funktioniert , müssen sich die Koeffizienten offensichtlich zu Eins summieren. Wenn die Koeffizienten in der Vektornotation λ = ( λ i ) 'geschrieben werden , kann dies sauber geschrieben werden 1 λ = 1 .μλ=(λi)1λ=1

Unter der Menge all dieser unverzerrten linearen Prädiktoren suchen wir einen, der so wenig wie möglich vom realen Wert abweicht , gemessen im Raummittelwertquadrat. Dies ist wiederum eine Berechnung. Es beruht auf der Bilinearität und Symmetrie der Kovarianz, deren Anwendung für die Summierungen in der zweiten Zeile verantwortlich ist:

E.[(Z.0^- -Z.0)2]]=E.[(λ1Z.1+λ2Z.2++λnZ.n- -Z.0)2]]=ich=1nj=1nλichλjvar[Z.ich,Z.j]]- -2ich=1nλichvar[Z.ich,Z.0]]+var[Z.0,Z.0]]=ich=1nj=1nλichλjΣich,j- -2ich=1nλichΣ0,ich+Σ0,0.

Woher können die Koeffizienten erhalten werden, indem diese quadratische Form unter der (linearen) Bedingung minimiert wird . Dies lässt sich leicht mit der Methode der Lagrange-Multiplikatoren lösen, wobei sich ein lineares Gleichungssystem ergibt, die "Kriging-Gleichungen".1λ=1

In der Anwendung ist ein räumlicher stochastischer Prozess ("Zufallsfeld"). Dies bedeutet, dass für jeden gegebenen Satz fester (nicht zufälliger) Orte x 0 , , x n der Wertevektor von Z an diesen Orten ( Z ( x 0 ) , , Z ( x n ) ) zufällig mit ist eine Art multivariate Verteilung. Schreiben Sie Z i = Z ( x i ) und wenden Sie die vorstehende Analyse an, vorausgesetztZ.x0,,xnZ.(Z.(x0),,Z.(xn))Z.ich=Z.(xich)Die Mittelwerte des Prozesses an allen Stellen x i sind gleich, und die Annahme der Kovarianzmatrix der Prozesswerte an diesen n + 1 Stellen ist mit Sicherheit bekannt.n+1xichn+1

Lassen Sie uns das interpretieren. Unter den Annahmen (einschließlich des konstanten Mittelwerts und der bekannten Kovarianz) bestimmen die Koeffizienten die minimale Varianz, die von jedem linearen Schätzer erreicht werden kann. Nennen wir diese Varianz ("OK" steht für "gewöhnliches Kriging"). Es kommt ausschließlich auf die Matrix Σ an . Es sagt uns, dass, wenn wir wiederholt von ( Z 0 , , Z n ) abtasten und diese Koeffizienten verwenden würden, um die z 0 -Werte jedes Mal aus den verbleibenden Werten vorherzusagenσÖK.2Σ(Z.0,,Z.n)z0

  1. Im Durchschnitt wären unsere Vorhersagen korrekt.

  2. z0σÖK.z0

Es muss noch viel mehr gesagt werden, bevor dies auf praktische Situationen wie das Schätzen einer Oberfläche aus pünktlichen Daten angewendet werden kann: Wir benötigen zusätzliche Annahmen darüber, wie sich die statistischen Merkmale des räumlichen Prozesses von einem Ort zum anderen und von einer Realisierung zur anderen unterscheiden (obwohl) In der Praxis wird normalerweise immer nur eine Realisierung verfügbar sein. Diese Darstellung sollte jedoch ausreichen, um zu verfolgen, wie die Suche nach einem "besten" unverzerrten linearen Prädiktor ("BLUP") direkt zu einem System linearer Gleichungen führt.


ΣΣΣund Vorhersagen einer Sammlung von Werten an unbekannten Orten. Sie erfordern etwas stärkere Annahmen (multivariate Normalität), um dieses Kunststück zu erreichen.

whuber
quelle
Es gibt da draußen eine Website, auf der sie gegen Kriging schimpfen, und es scheint, als hätte er einige gültige Punkte. Ich denke, Ihr letzter Absatz hier ist sehr aufschlussreich.
Wayne
@ Wayne Ja, du kannst sagen, worauf ich reagiere. Obwohl Kriging von Beratern als "Schlangenöl" verwendet wurde, hat es viel zu bieten, einschließlich einer Theorie der "Änderung der Unterstützung", um Daten, die aus (sagen wir) winzigen Proben eines Mediums stammen, mit Daten zu vergleichen, die aus viel größeren Daten stammen Teile dieses Mediums. Kriging steht heute am Ende der ausgefeiltesten räumlich-zeitlichen Modellierung. Es ist auch eine nützliche Methode, um alternative Vorschläge zu bewerten: Beispielsweise sind viele räumliche Interpolatoren linear (oder können linearisiert werden), sodass es fair ist, ihre Schätzungsvarianz mit der von Kriging zu vergleichen.
whuber
1

Kriging ist einfach eine Schätzung der kleinsten Quadrate für räumliche Daten. Als solches bietet es einen linearen unverzerrten Schätzer, der die Summe der quadratischen Fehler minimiert. Da es unverzerrt ist, ist die MSE = die Schätzervarianz und ist ein Minimum.

Michael R. Chernick
quelle
Ich habe den Teil, der den Kriging-Fehler berechnet, nicht erhalten. Außerdem bin ich mit Kriging-Varianz und Varianz verwechselt. Was ist der Unterschied und was ist ihre Bedeutung
user31820
@whuber. Vielen Dank für die Erklärung, aber ich habe die Gleichungsableitung nicht erhalten, als Sie die MSE des Werts berechnet haben, der durch die unverzerrte Schätzung und den wahren Schätzer vorhergesagt wurde. Die zweite Zeile, um in dieser Gleichung spezifisch zu sein
user31820
@whuber Außerdem habe ich den Wiki-Teil nicht erhalten, als er die Kriging-Varianz berechnet, die der in Ihrer Antwort ähnelt. Sie haben die gleichen Ergebnisse, aber die Anfangsbedingungen sind unterschiedlich. Woher?
user31820