Wie man die Auswirkung von Feiertagen in der Prognose berücksichtigt

12

Ich habe eine ziemlich vorhersehbare tägliche Zeitreihe mit wöchentlicher Saisonalität. Ich bin in der Lage, Vorhersagen zu treffen, die ziemlich genau zu sein scheinen (bestätigt durch eine Kreuzvalidierung), wenn es keine Feiertage gibt. In den Ferien habe ich jedoch folgende Probleme:

  1. In meiner Prognose erhalte ich Zahlen ungleich Null für die Feiertage, obwohl alle historischen Feiertage 0 sind. Dies ist jedoch nicht das Hauptproblem. Das Problem ist ...
  2. Da die Verarbeitung, die an Feiertagen nicht stattfindet, bis zu den Tagen nach den Feiertagen "überläuft", wird sie von einer einfachen Dummy-Variablen nicht abgeschnitten, da diese Ausreißer kurzfristig innovativ zu sein scheinen. Wenn es keine wöchentliche Saisonalität gäbe, könnte ich vielleicht eine Schätzung für die Verteilung der unverarbeiteten Daten im Urlaub auf die ungefähr fünf Tage nach dem Urlaub ausarbeiten (wie unter Wie werden Variablen erstellt, die die Auswirkung von Urlaub auf Vor- und Nachlauf widerspiegeln). Kalendereffekte in einer Zeitreihenanalyse? ). Die Verteilung des "Überlaufs" hängt jedoch vom Wochentag ab, an dem der Feiertag stattfindet, und davon, ob es sich um Weihnachten oder Erntedankfest handelt, bei denen Bestellungen zu einem niedrigeren Preis als im Rest des Jahres eingehen.

Hier sind einige Momentaufnahmen aus meiner Kreuzvalidierung, die das vorhergesagte (blaue) und das tatsächliche (rote) Ergebnis für Feiertage zeigen, die an verschiedenen Wochentagen angezeigt werden:

Bildbeschreibung hier eingeben

Ich mache mir auch Sorgen, dass die Auswirkung von Weihnachten vom Wochentag abhängt, auf den es fällt, und ich habe nur ungefähr sechs Jahre historische Daten.

Hat jemand Vorschläge, wie mit solchen innovativen Ausreißern im Rahmen von Prognosen umgegangen werden kann? (Leider kann ich keine Daten teilen)

Julia Maddalena
quelle
1
Das interessiert mich auch sehr.
EngrStudent
2
Wenn Sie Ihre Daten nicht veröffentlichen können, können Sie möglicherweise erfundene Daten veröffentlichen, die Ihren Daten ähnlich sind. In vielen Fällen erleichtert dies relevantere Antworten.
Tim
1
Skalieren Sie die Daten. Das Modell ist das gleiche (nur skaliert). Sie können die Prognosen sogar auf Ihre ursprüngliche Metrik zurückskalieren.
Tom Reilly

Antworten:

1

Könnten Sie nicht eine Dummy-Variable für Urlaub erstellen, eine für Urlaub + 1 und eine für Urlaub + 2, und sie nur auf 1 setzen, solange sie auf einen Wochentag fallen?

Was Thanksgiving und Weihnachten angeht, scheint die Einführung separater Dummy-Variablen für diese Feiertage Ihre schlechteste Option zu sein (da Sie nur Daten für sechs Jahre haben). Bis zu einem gewissen Grad könnte dies jedoch Ihre einzige Option sein - die Menschen verhalten sich an diesen Feiertagen einfach anders als beispielsweise am 4. Juli (und wenn Sie sich beispielsweise mit Einzelhandelsverkaufsmustern befassen, müssen Sie auf jeden Fall einfach mit diesen leben "besondere" Feiertage sein und diese definitiv separat analysieren wollen). Vielleicht sind die folgenden Ideen für Sie hilfreich:

  • Das Erntedankfest. Sollte es nicht einfacher sein, dass es immer am selben Wochentag (Donnerstag) fällt? Das heißt, ein Thanksgiving-Dummy ist möglicherweise sogar in einem Sechsjahresdatensatz funktionsfähig, da das Wochentagsmuster immer das gleiche ist.
  • Weihnachten. Wenn ich mir Ihre Grafik anschaue, scheint mir das Hauptproblem zu sein, dass der Effekt länger anhält als nach anderen Feiertagen. Wenn Sie "Weihnachten" als Heiligabend (24. Dezember) definieren, dann liegt das daran, dass viele Menschen auch zu Hause bleiben Weihnachtstag (25. Dezember) (und an manchen Orten sogar Weihnachtstag (26. Dezember)). Ich werde noch etwas darüber nachdenken.

Ich hoffe das hilft.

Candamir
quelle