Die Daten: Ich habe kürzlich an der Analyse der stochastischen Eigenschaften eines räumlich-zeitlichen Feldes von Prognosefehlern für die Windkraftproduktion gearbeitet. Formal kann man sagen, dass es sich um einen Prozess handelt zweimal in der Zeit (mittundh) und einmal im Raum (p)indiziert,wobeiHdie Anzahl der Vorausschauzeiten ist (entspricht etwa24, regelmäßig abgetastet),Tdie Anzahl von "Vorhersagezeiten" (dh Zeiten, zu denen die Vorhersage ausgegeben wird, in meinem Fall ungefähr 30000, regelmäßig abgetastet) undneine Anzahl von räumlichen Positionen (in meinem Fall ungefähr 300, nicht gerastert). Da dies ein wetterbezogener Prozess ist, habe ich auch viele Wettervorhersagen, Analysen und meteorologische Messungen, die verwendet werden können.
Frage: Können Sie mir die explorative Analyse beschreiben, die Sie für diese Art von Daten durchführen würden, um die Art der Interdependenzstruktur (die möglicherweise nicht linear ist) des Prozesses zu verstehen, um eine genaue Modellierung des Prozesses vorzuschlagen?
quelle
Antworten:
Es scheint mir, dass Sie über genügend Daten verfügen, um die Abhängigkeit von Raum-Zeit- und meteorologischen Einflüssen sowohl von Prognosefehlern (dh Tendenz zur systematischen Über- / Unterschätzung [erster Moment]) als auch von deren Varianz [zweiter Moment] zu modellieren.
Um die Tendenz zu untersuchen, würde ich einfach viele Streudiagramme, Heatmaps oder Hexbin-Diagramme erstellen. Um die Variabilität zu untersuchen, würde ich einfach die ursprünglichen Fehler quadrieren und dann wieder viele Streudiagramme, Heatmaps oder Hexbin-Diagramme erstellen. Dies ist natürlich nicht ganz unproblematisch, wenn Sie viele Vorurteile haben, aber es kann trotzdem hilfreich sein, Muster einer von Kovariaten beeinflussten Heteroskedastizität zu erkennen.
Meine Kollegen haben einen netten technischen Bericht erstellt, in dem eine sehr flexible Methode zum Anpassen dieser Art von Modellen beschrieben ist (bei Bedarf können auch höhere Momente modelliert werden), die auch ein gutt h , Tensorprodukt-Splines für temporäumliche Effekte oder reibungslose Wechselwirkungen meteorologischer Effekte usw ..) für die verschiedenen Momente und führen gleichzeitig eine Begriffswahl durch, um ein sparsames und interpretierbares Modell zu erhalten. Die Hoffnung wäre, dass die Begriffe in diesem Modell ausreichen, um die räumlich-zeitliche Autokorrelationsstruktur der Prognosefehler zu berücksichtigen. Sie sollten jedoch die Residuen dieser Modelle auf Autokorrelation prüfen (z. B. einige Variogramme und ACFs betrachten).
R
implementiertes GamboostLSS enthält, basierend aufmboost
: Mayr, Andreas; Fenske, Nora; Hofner, Benjamin; Kneib, Thomas und Schmid, Matthias (2010): GAMLSS für hochdimensionale Daten - ein flexibler Ansatz, der auf Boosten basiert. . Angenommen, Sie haben Zugriff auf Computer mit viel RAM (Ihre Datenmenge scheint GROSS zu sein), können Sie alle Arten von semiparametrischen Effekten abschätzen (z. B. Schätzer für glatte Oberflächen für räumliche Effekte oder den gemeinsamen Effekt von und h)quelle
Wir (ein Kollege und ich) haben endlich einen Artikel darüber geschrieben. Um die Dinge zusammenzufassen, haben wir zwei Lösungen vorgeschlagen, um die (räumlich-zeitliche) Ausbreitung von Fehlern entlang Dänemarks und der Vorausschauzeiten zu quantifizieren und statistisch zusammenzufassen.
Dies kann verwendet werden, um einen globalen Ausbreitungsvektor zu berechnen, dh eine Art räumlicher Durchschnitt der Ausbreitungsgeschwindigkeiten zwischen Paaren. Ein Teil davon ist auf der linken Seite von Abbildung 1 dargestellt. Erraten Sie, welche Fehlerausbreitung West-Ost in Denamrk ist (ok, das war keine große Überraschung :)). Wir haben dies auch bedingt auf verschiedene meteorologische Situationen analysiert, um den Zusammenhang zwischen Ausbreitung und Wind (Geschwindigkeit, Richtung) aufzuzeigen.
Im zweiten Fall beobachteten wir, dass die Ausbreitungsgeschwindigkeit des zeitlichen Mittelwerts einen ähnlichen Wert aufweist wie der des räumlichen Mittelwerts im ersten Fall. Wenn Sie sich diese Arbeit genauer ansehen möchten, finden Sie hier das Papier .
quelle