Ich habe eine ziemlich vorhersehbare tägliche Zeitreihe mit wöchentlicher Saisonalität. Ich bin in der Lage, Vorhersagen zu treffen, die ziemlich genau zu sein scheinen (bestätigt durch eine Kreuzvalidierung), wenn es keine Feiertage gibt. In den Ferien habe ich jedoch folgende Probleme:
- In meiner Prognose erhalte ich Zahlen ungleich Null für die Feiertage, obwohl alle historischen Feiertage 0 sind. Dies ist jedoch nicht das Hauptproblem. Das Problem ist ...
- Da die Verarbeitung, die an Feiertagen nicht stattfindet, bis zu den Tagen nach den Feiertagen "überläuft", wird sie von einer einfachen Dummy-Variablen nicht abgeschnitten, da diese Ausreißer kurzfristig innovativ zu sein scheinen. Wenn es keine wöchentliche Saisonalität gäbe, könnte ich vielleicht eine Schätzung für die Verteilung der unverarbeiteten Daten im Urlaub auf die ungefähr fünf Tage nach dem Urlaub ausarbeiten (wie unter Wie werden Variablen erstellt, die die Auswirkung von Urlaub auf Vor- und Nachlauf widerspiegeln). Kalendereffekte in einer Zeitreihenanalyse? ). Die Verteilung des "Überlaufs" hängt jedoch vom Wochentag ab, an dem der Feiertag stattfindet, und davon, ob es sich um Weihnachten oder Erntedankfest handelt, bei denen Bestellungen zu einem niedrigeren Preis als im Rest des Jahres eingehen.
Hier sind einige Momentaufnahmen aus meiner Kreuzvalidierung, die das vorhergesagte (blaue) und das tatsächliche (rote) Ergebnis für Feiertage zeigen, die an verschiedenen Wochentagen angezeigt werden:
Ich mache mir auch Sorgen, dass die Auswirkung von Weihnachten vom Wochentag abhängt, auf den es fällt, und ich habe nur ungefähr sechs Jahre historische Daten.
Hat jemand Vorschläge, wie mit solchen innovativen Ausreißern im Rahmen von Prognosen umgegangen werden kann? (Leider kann ich keine Daten teilen)
quelle
Antworten:
Könnten Sie nicht eine Dummy-Variable für Urlaub erstellen, eine für Urlaub + 1 und eine für Urlaub + 2, und sie nur auf 1 setzen, solange sie auf einen Wochentag fallen?
Was Thanksgiving und Weihnachten angeht, scheint die Einführung separater Dummy-Variablen für diese Feiertage Ihre schlechteste Option zu sein (da Sie nur Daten für sechs Jahre haben). Bis zu einem gewissen Grad könnte dies jedoch Ihre einzige Option sein - die Menschen verhalten sich an diesen Feiertagen einfach anders als beispielsweise am 4. Juli (und wenn Sie sich beispielsweise mit Einzelhandelsverkaufsmustern befassen, müssen Sie auf jeden Fall einfach mit diesen leben "besondere" Feiertage sein und diese definitiv separat analysieren wollen). Vielleicht sind die folgenden Ideen für Sie hilfreich:
Ich hoffe das hilft.
quelle