Ich verwende eine tägliche Zeitreihe von Verkaufsdaten, die etwa 2 Jahre tägliche Datenpunkte enthält. Anhand einiger Online-Tutorials / Beispiele habe ich versucht, die Saisonalität in den Daten zu identifizieren. Es scheint eine wöchentliche, monatliche und wahrscheinlich jährliche Periodizität / Saisonalität zu geben.
Beispielsweise gibt es Zahltage, insbesondere am ersten Zahltag des Monatseffekts, der einige Tage in der Woche anhält. Es gibt auch einige spezifische Feiertagseffekte, die anhand der Beobachtungen klar erkennbar sind.
Ausgestattet mit einigen dieser Beobachtungen habe ich Folgendes versucht:
ARIMA (mit
Arima
undauto.arima
von R-Forecast-Paket) mit Regressor (und anderen Standardwerten, die in der Funktion benötigt werden). Der von mir erstellte Regressor ist im Grunde eine Matrix mit 0/1 Werten:- 11 Monate (n-1) Variablen
- 12 Urlaubsvariablen
- Konnte den Zahltag-Teil nicht herausfinden ... da es wenig komplizierter ist als ich dachte. Der Zahltag-Effekt funktioniert je nach Wochentag des 1. Monats unterschiedlich.
Ich habe 7 (dh wöchentliche Häufigkeit) verwendet, um die Zeitreihen zu modellieren. Ich habe den Test 7 Tage hintereinander ausprobiert. Die Ergebnisse sind angemessen: Die durchschnittliche Genauigkeit für eine Prognose von 11 Wochen liegt bei einem wöchentlichen durchschnittlichen RMSE-Wert von 5%.
TBATS-Modell (aus dem R-Forecast-Paket) - mit multipler Saisonalität (7, 30.4375, 365.25) und offensichtlich ohne Regressor. Die Genauigkeit ist überraschend besser als beim ARIMA-Modell bei wöchentlich durchschnittlich 3,5% RMSE.
In diesem Fall schneidet das Modell ohne ARMA-Fehler etwas besser ab. Wenn ich nun die Koeffizienten nur für die Urlaubseffekte aus dem in Nr. 1 beschriebenen ARIMA-Modell auf die Ergebnisse des TBATS-Modells anwende, verbessert sich der wöchentliche durchschnittliche RMSE auf 2,95%.
Ohne viel Hintergrundwissen über die zugrunde liegenden Theorien dieser Modelle zu haben, bin ich in einem Dilemma, ob dieser TBATS-Ansatz überhaupt gültig ist. Obwohl es den RMSE im elfwöchigen Test erheblich verbessert, frage ich mich, ob es diese Genauigkeit in Zukunft aufrechterhalten kann. Oder auch wenn die Anwendung von Urlaubseffekten von ARIMA auf das TBATS-Ergebnis gerechtfertigt ist. Alle Gedanken von jedem / allen Mitwirkenden werden sehr geschätzt.
Hinweis: Wählen Sie "Verknüpfung speichern unter", um die Datei herunterzuladen.
Antworten:
Sie sollten Modelle und Vorhersagen unterschiedlicher Herkunft über verschiedene Horizonte hinweg und nicht eine einzige Zahl bewerten, um einen Ansatz zu beurteilen.
Ich gehe davon aus, dass Ihre Daten aus den USA stammen. Ich bevorzuge mehr als drei Jahre täglicher Daten, da zwei Feiertage an einem Wochenende landen und kein Wochentag gelesen werden kann. Es sieht so aus, als ob Ihr Thanksgiving-Effekt einen freien Tag im Jahr 2012 hat oder ein Aufnahmefehler aufgetreten ist und das Modell den Thanksgiving-Tag-Effekt verpasst hat.
Januar sind in der Regel in der Datenmenge niedrig, wenn Sie als% des Jahres betrachten. Wochenenden sind hoch. Die Dummies spiegeln dieses Verhalten wider. MONTH_EFF01, FIXED_EFF_N10507, FIXED_EFF_N10607
Ich habe festgestellt, dass die Verwendung einer AR-Komponente mit täglichen Daten davon ausgeht, dass das Muster für die letzten zwei Wochen des Wochentags im Allgemeinen dem Muster entspricht, was eine große Annahme ist. Wir begannen mit 11 monatlichen und 6 täglichen Dummies. Einige schieden aus dem Modell aus. B ** 1 bedeutet, dass am Tag nach einem Feiertag eine Verzögerung auftritt. Es gab 6 Sondertage des Monats (Tage 2,3,5,21,29,30 ---- 21 könnten falsch sein?) Und 3 Zeittrends, 2 saisonale Impulse (an denen ein Wochentag abweichend von dem begann) Normalerweise eine 0 vor diesen Daten und eine 1 alle 7 Tage danach) und 2 Ausreißer (beachten Sie das Erntedankfest!). Die Ausführung dauerte knapp 7 Minuten. Laden Sie alle Ergebnisse hier herunter: www.autobox.com/se/dd/daily.zip
Es enthält ein schnelles und schmutziges XLS-Blatt, mit dem überprüft werden kann, ob das Modell sinnvoll ist. Natürlich sind die XLS% in der Tat schlecht, da sie grobe Benchmarks sind.
Versuchen Sie, dieses Modell zu schätzen:
quelle