Sie haben eine sogenannte intermittierende Nachfrage , dh eine Nachfragezeitreihe, die durch "viele" Nullen gekennzeichnet ist. (Wenn Ihre Zeitreihe per se nicht nachgefragt wird, gilt das meiste der folgenden Punkte weiterhin.) Eine Websuche nach "Prognose des intermittierenden Bedarfs" wäre also bereits hilfreich. Teunter und Duncan (2009, JORS) geben einen Überblick über Methoden zur intermittierenden Bedarfsprognose.
Die Standardmethode zur Vorhersage intermittierender Anforderungen ist die Croston-Methode. Verwenden Sie die exponentielle Glättung in Intervallen zwischen Anforderungen und bei Bedarfsgrößen ungleich Null separat . Die Punktprognose ist dann das Verhältnis des geglätteten Bedarfs ungleich Null zum geglätteten Intervall zwischen Anforderungen. Syntetos und Boylan (2001, IJPE) stellen fest, dass Croston leicht voreingenommen ist und eine Modifikation vorschlägt, aber dies macht in der Praxis normalerweise keinen großen Unterschied.
Eine Alternative sind integer autoregressive Moving Average-Modelle (INARMA), die die Standard-ARIMA-Zeitreihenmodelle modifizieren. Maryam Mohammadipour hat eine These dazu geschrieben .
Ich persönlich habe große Zweifel an der Nützlichkeit einer solchen Erwartungspunktprognose. Eine Zeitreihe von 1 Bedarf in jedem zweiten Zeitraum hat eine Erwartung von 0,5 ... ebenso wie eine Zeitreihe von 2 Anforderungen in jedem vierten Zeitraum ... und so weiter - obwohl dies natürlich immer weniger Poisson-y ist . Ich würde argumentieren, dass es viel nützlicher ist, die gesamte zukünftige (und vorausschauende) Verteilung der Anforderungen zu verstehen. Ich begrüße Ihre Suche nach Vorhersageintervallen!
α ( n - 2 )y^λ = y^
Shenstone und Hyndman (2005, JoF) stellen fest, dass es kein konsistentes stochastisches Modell gibt, für das Crostons Methode optimal wäre - alle Kandidatenmodelle sind (1) kontinuierlich, nicht diskret und (2) können negative Werte ergeben. Für diese Kandidatenmodelle stellen Shenstone und Hyndman jedoch Vorhersageintervalle bereit.
Abschließend noch ein Wort der Vorsicht: nicht verwenden , um den MAD für die Beurteilung der Genauigkeit der Prognosen Zähldaten, schon gar nicht für die intermittierenden Anforderungen. Der erwartete MAD wird durch den Median Ihrer zukünftigen Verteilung minimiert , nicht durch den Mittelwert . Wenn Sie schreiben, dass 65% Ihrer Daten Nullen sind, ist der Median Null ... was bedeutet, dass Sie wahrscheinlich den niedrigsten MAD durch eine Wohnung erhalten Null-Prognose, die stark voreingenommen und wahrscheinlich nutzlos ist. Hier ist eine Präsentation, die ich letztes Jahr auf dem Internationalen Symposium für Prognosen zu diesem Thema gehalten habe. Oder schauen Sie sich Morlidge (2015, Foresight) an .
Letztes Stück schamloser Eigenwerbung: Ich habe einen Artikel in der IJF (Kolassa, 2016), der sich mit der Vorhersage von Daten mit geringer Volumenzahl (meist intermittierend), verschiedenen Genauigkeitsmaßen und verschiedenen Prognosemethoden befasst, einschließlich verschiedener Arten von Poisson-Modellen. Dies kann für Sie nützlich sein.
qi
pro Gruppe einen Wert von 1 haben. Ein niedrigerer Wert ist nicht wirklich möglich, sodass davon ausgegangen werden kann, dass die meisten meiner Gruppen nicht intermittierend sind, oder?