Es scheint keinen Standard für den Umgang mit fehlenden Daten im Kontext der Modellfamilie der exponentiellen Glättung zu geben. Insbesondere die R-Implementierung mit dem Namen ets im Prognosepaket scheint die längste Folge ohne fehlende Daten zu haben, und das Buch "Forecasting with Exponential Smoothing" von Hyndman et al. scheint überhaupt nicht über fehlende Daten zu sprechen.
Ich würde gerne etwas mehr tun, wenn meine Benutzer mich ausdrücklich darum bitten (und wenn die fehlenden Daten nicht zu nahe beieinander liegen oder in zu vielen Zeiträumen, die genau eine Saison auseinander liegen). Ich denke insbesondere an Folgendes. Während der Simulation, wenn ich einen fehlenden Wert begegnen würde , würde ich die aktuelle Punktprognose ersetzen ~ y t für y t , so dass ε t = 0 . Dies würde beispielsweise dazu führen, dass der Datenpunkt für den Parameteroptimierungsprozess nicht berücksichtigt wird.
Gibt es bekannte Fallstricke bei dieser Methode?
quelle
Antworten:
Ihr Ansatz macht Sinn. Genau das tat eine kommerzielle Software, mit der ich einige Jahre lang in Verbindung stand.
Ihre Gliederung gilt für das einfache exponentielle Glätten (Single Exponential Smoothing, SES). Sie können jedoch auch Trend- oder saisonale Komponenten entsprechend behandeln. Für die saisonalen müssten Sie, genau wie für die Aktualisierung, einen vollständigen saisonalen Zyklus zurückgehen.
Eine andere Alternative wäre natürlich, fehlende Werte einfach zu interpolieren. Dies ist eine Option in neueren Versionen von
ets(..., na.action="na.interp")
.Nach dem, was ich über Zustandsmodelle weiß, sollte es nicht allzu schwer sein, die fehlenden Daten einfach als unbemerkt zu behandeln. Ich bin nicht sicher, warum dies nicht im
forecast
Paket implementiert ist . Eine schnelle Suche in Rob Hyndmans Blog ergab eigentlich nichts Nützliches.quelle