auto.arima erkennt kein saisonales Muster

8

Ich habe einen täglichen Wetterdatensatz, der wenig überraschend einen sehr starken saisonalen Effekt hat.

Geben Sie hier die Bildbeschreibung ein

Ich habe ein ARIMA-Modell mit der Funktion auto.arima aus dem Prognosepaket an diesen Datensatz angepasst. Zu meiner Überraschung wendet die Funktion keine saisonalen Operationen an - saisonale Differenzierung, saisonale ar- oder ma-Komponenten. Hier ist das Modell, das es geschätzt hat:

library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)

Series: data
ARIMA(3,0,1) with non-zero mean 

Coefficients:
         ar1      ar2     ar3      ma1  intercept
      1.7722  -0.9166  0.1412  -0.8487   283.0378
s.e.  0.0260   0.0326  0.0177   0.0214     1.7990

sigma^2 estimated as 5.56:  log likelihood=-8313.74
AIC=16639.49   AICc=16639.51   BIC=16676.7

Und auch die Prognosen mit diesem Modell sind nicht wirklich zufriedenstellend. Hier ist die Darstellung der Prognose: Geben Sie hier die Bildbeschreibung ein

Kann mir jemand einen Hinweis geben, was hier falsch ist?

Datengräber
quelle
Können Sie den Code (oder ein ähnliches Beispiel) veröffentlichen, mit dem Sie die Ausgabe erhalten haben?
Rbatt
Hallo rbat, ich habe den Code gepostet, den ich verwendet habe. Die Rohdaten werden unter 'Daten' gespeichert. Ich habe es zuerst in ts Objekt konvertiert
DatamineR
Ihr MA (1) -Koeffizient (-.84) liegt verdächtig nahe bei -1 der Invertierbarkeitsgrenze, was (für mich) darauf hindeutet, dass Sie den ahnungslosen Daten eine schlechte Modellspezifikation auferlegt haben. Bitte geben Sie einen Link zu den tatsächlichen Rohdaten an. Ich werde versuchen, Ihnen dabei zu helfen, einen differenzierteren Ansatz zu verwenden als den, auf den Sie derzeit Zugriff haben. Dies könnte Aufschluss über Ihre gewünschte Lösung geben.
IrishStat
Vielen Dank an IrishStat für das Angebot! Ich bin nur verwirrt, warum 'auto.arima' hier kein saisonales Modell schätzt, obwohl die Saisonalität offensichtlich ist. Wenn ich hier ein Modell schätzen müsste, würde ich wahrscheinlich die Saisonalität mit der Fourier-Methode entfernen oder nur saisonal (in diesem Fall mit Verzögerung = 365) die Daten differenzieren. Aber sollte 'auto.arima' nicht die entsprechende Differenzierung vornehmen? Ich habe versucht, die Daten anzuhängen, aber keine Möglichkeit gefunden, dies zu tun. Wie kann man die Daten in die Frage einfügen?
DatamineR
Wenn Sie möchten, können Sie mir eine E-Mail senden. Hängen Sie eine Excel-Datei mit Informationen zum Startdatum an und ich werde sie an die Gruppe senden. Bitte schauen Sie auf meine Kontaktinformationen, um meine E-Mail-Adresse zu erhalten.
IrishStat

Antworten:

11

R passt nicht zu einem ARIMA-Modell mit einer Saisonalität von mehr als 350. Eine Diskussion dieses Problems finden Sie unter http://robjhyndman.com/hyndsight/longseasonality/ . Die Lösung besteht darin, Fourier-Terme für die Saisonalität und ARMA-Fehler für die kurzfristige Dynamik zu verwenden.

Rob Hyndman
quelle
7

Die Lösung für Ihr Problem besteht darin, wie Rob betont, deterministische Effekte (Woche des Jahres) und stochastische Effekte (ARIMA-Struktur) zu kombinieren, ungewöhnliche Tage zu isolieren und das mögliche Vorhandensein einer oder mehrerer Ebenenverschiebungen und / oder einer oder mehrerer lokaler Ebenen zu erkennen Zeittrends. AUTOBOX, die für die Analyse verwendete Software, wurde teilweise von mir entwickelt, um automatisch eine robuste Modellierung für solche Datensätze bereitzustellen.

Ich habe Ihre Daten unter http://www.autobox.com/weather/weather.txt abgelegt .

Der ACF der Originaldaten Geben Sie hier die Bildbeschreibung einführt zu einer automatischen Modellauswahl des Formulars Geben Sie hier die Bildbeschreibung ein Geben Sie hier die Bildbeschreibung ein Geben Sie hier die Bildbeschreibung ein. Die Modellstatistik enthält Geben Sie hier die Bildbeschreibung einein Restdiagramm von Geben Sie hier die Bildbeschreibung einDas Diagramm der Prognosen für die nächsten 60 Tage wird hier dargestellt. Das Geben Sie hier die Bildbeschreibung einDiagramm Ist / Anpassung / Prognose wird hier angezeigt.Geben Sie hier die Bildbeschreibung ein

Für andere könnte es interessant sein, den Ratschlägen von Prof. Hyndaman zu folgen und ihr endgültiges Modell mit disgnostischen Kontrollen in Bezug auf Restdiagnostik und Parametertests von Bedeutung zu melden.

Ich persönlich fühle mich unwohl mit dem Vorschlag, zuerst eine Fourier-Analyse durchzuführen (möglicherweise / wahrscheinlich durch Anomalien beeinflusst) und dann ARIMA für die Residuen durchzuführen, da dies keine gleichzeitige Lösung ist, die zu einer Gleichung führt, sondern eine vermutete Sequenz. Meine Gleichung verwendet die Woche des Monats und enthält auch einen AR (1) und Abhilfemaßnahmen für die ungewöhnlichen Datenpunkte.

Alle Software hat Einschränkungen und es ist gut, sie zu kennen. Ich wiederhole noch einmal, warum nicht jemand versucht, Robs Vorschläge umzusetzen und die vollständigen Ergebnisse zu zeigen.

IrishStat
quelle