Ich habe einen täglichen Wetterdatensatz, der wenig überraschend einen sehr starken saisonalen Effekt hat.
Ich habe ein ARIMA-Modell mit der Funktion auto.arima aus dem Prognosepaket an diesen Datensatz angepasst. Zu meiner Überraschung wendet die Funktion keine saisonalen Operationen an - saisonale Differenzierung, saisonale ar- oder ma-Komponenten. Hier ist das Modell, das es geschätzt hat:
library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)
Series: data
ARIMA(3,0,1) with non-zero mean
Coefficients:
ar1 ar2 ar3 ma1 intercept
1.7722 -0.9166 0.1412 -0.8487 283.0378
s.e. 0.0260 0.0326 0.0177 0.0214 1.7990
sigma^2 estimated as 5.56: log likelihood=-8313.74
AIC=16639.49 AICc=16639.51 BIC=16676.7
Und auch die Prognosen mit diesem Modell sind nicht wirklich zufriedenstellend. Hier ist die Darstellung der Prognose:
Kann mir jemand einen Hinweis geben, was hier falsch ist?
r
time-series
forecasting
arima
arma
Datengräber
quelle
quelle
Antworten:
R passt nicht zu einem ARIMA-Modell mit einer Saisonalität von mehr als 350. Eine Diskussion dieses Problems finden Sie unter http://robjhyndman.com/hyndsight/longseasonality/ . Die Lösung besteht darin, Fourier-Terme für die Saisonalität und ARMA-Fehler für die kurzfristige Dynamik zu verwenden.
quelle
Die Lösung für Ihr Problem besteht darin, wie Rob betont, deterministische Effekte (Woche des Jahres) und stochastische Effekte (ARIMA-Struktur) zu kombinieren, ungewöhnliche Tage zu isolieren und das mögliche Vorhandensein einer oder mehrerer Ebenenverschiebungen und / oder einer oder mehrerer lokaler Ebenen zu erkennen Zeittrends. AUTOBOX, die für die Analyse verwendete Software, wurde teilweise von mir entwickelt, um automatisch eine robuste Modellierung für solche Datensätze bereitzustellen.
Ich habe Ihre Daten unter http://www.autobox.com/weather/weather.txt abgelegt .
Der ACF der Originaldaten führt zu einer automatischen Modellauswahl des Formulars . Die Modellstatistik enthält ein Restdiagramm von Das Diagramm der Prognosen für die nächsten 60 Tage wird hier dargestellt. Das Diagramm Ist / Anpassung / Prognose wird hier angezeigt.
Für andere könnte es interessant sein, den Ratschlägen von Prof. Hyndaman zu folgen und ihr endgültiges Modell mit disgnostischen Kontrollen in Bezug auf Restdiagnostik und Parametertests von Bedeutung zu melden.
Ich persönlich fühle mich unwohl mit dem Vorschlag, zuerst eine Fourier-Analyse durchzuführen (möglicherweise / wahrscheinlich durch Anomalien beeinflusst) und dann ARIMA für die Residuen durchzuführen, da dies keine gleichzeitige Lösung ist, die zu einer Gleichung führt, sondern eine vermutete Sequenz. Meine Gleichung verwendet die Woche des Monats und enthält auch einen AR (1) und Abhilfemaßnahmen für die ungewöhnlichen Datenpunkte.
Alle Software hat Einschränkungen und es ist gut, sie zu kennen. Ich wiederhole noch einmal, warum nicht jemand versucht, Robs Vorschläge umzusetzen und die vollständigen Ergebnisse zu zeigen.
quelle