Umgang mit fehlenden Daten in einem exponentiellen Glättungsmodell

14

Es scheint keinen Standard für den Umgang mit fehlenden Daten im Kontext der Modellfamilie der exponentiellen Glättung zu geben. Insbesondere die R-Implementierung mit dem Namen ets im Prognosepaket scheint die längste Folge ohne fehlende Daten zu haben, und das Buch "Forecasting with Exponential Smoothing" von Hyndman et al. scheint überhaupt nicht über fehlende Daten zu sprechen.

Ich würde gerne etwas mehr tun, wenn meine Benutzer mich ausdrücklich darum bitten (und wenn die fehlenden Daten nicht zu nahe beieinander liegen oder in zu vielen Zeiträumen, die genau eine Saison auseinander liegen). Ich denke insbesondere an Folgendes. Während der Simulation, wenn ich einen fehlenden Wert begegnen würde , würde ich die aktuelle Punktprognose ersetzen ~ y t für y t , so dass ε t = 0 . Dies würde beispielsweise dazu führen, dass der Datenpunkt für den Parameteroptimierungsprozess nicht berücksichtigt wird.yty~tytεt=0

0ϵt

Gibt es bekannte Fallstricke bei dieser Methode?

Erik P.
quelle
Haben Sie darüber nachgedacht, einen Gauß-Prozess mit einem exponentiellen Kovarianzkern zu verwenden? Scheint eine natürliche Möglichkeit zu sein, mit fehlenden Daten umzugehen und Konfidenzintervalle abzuleiten. R hat das GPFit-Paket, das Sie sich ansehen können.
LE Rogerson

Antworten:

1

Ihr Ansatz macht Sinn. Genau das tat eine kommerzielle Software, mit der ich einige Jahre lang in Verbindung stand.

Ihre Gliederung gilt für das einfache exponentielle Glätten (Single Exponential Smoothing, SES). Sie können jedoch auch Trend- oder saisonale Komponenten entsprechend behandeln. Für die saisonalen müssten Sie, genau wie für die Aktualisierung, einen vollständigen saisonalen Zyklus zurückgehen.

Eine andere Alternative wäre natürlich, fehlende Werte einfach zu interpolieren. Dies ist eine Option in neueren Versionen von ets(..., na.action="na.interp").

Nach dem, was ich über Zustandsmodelle weiß, sollte es nicht allzu schwer sein, die fehlenden Daten einfach als unbemerkt zu behandeln. Ich bin nicht sicher, warum dies nicht im forecastPaket implementiert ist . Eine schnelle Suche in Rob Hyndmans Blog ergab eigentlich nichts Nützliches.

S. Kolassa - Setzen Sie Monica wieder ein
quelle