Vorhersage von Poisson, Genauigkeit und Vorhersageintervallen

8

Ich versuche, PoissonDaten, die in Gruppen unterteilt sind 1-26 months of data, je nach Gruppe vorherzusagen. Von den gepoolten Daten 65% has a value of 0und 25% a value of 1. Ich konnte keine Trends oder Saisonalität finden und begann, ein paar verschiedene Modelle von Schreibwaren zu testen. Moving average (3), Moving Average (6), Simple Exponential Smoothing, NaïveUnd Simple Mean.

Ich brauche 1-6 Monate im Voraus und zur Prognose MAD, MSEund RMSEdie Genauigkeit der Modelle zu testen. Es sieht so aus, als ob Simple Mean mit einem RMSE of 1und einem am genauesten ist MAD of 0,638. Ich denke, das ist wirklich hoch, aber ich habe keine Ahnung, wie ich etwas dagegen tun soll.

Gibt es Prognosemethoden, über die ich nicht nachgedacht habe, dass sie viel besser sein könnten? Übersehe ich etwas?

Das einzige, was ich über Vorhersageintervalle finden konnte, war F+tsund F-tsmit Fals Vorhersage, tals t-Verteilung mit alfa (n-2)und sals Standardabweichung. Ich glaube nicht, dass es eine wirklich vertrauenswürdige Quelle war, aber da ich nichts anderes finden konnte, bin ich mir nicht sicher, wie ich diese Vorhersageintervalle einrichten soll. Ist diese Methode richtig?

Ich habe kein R zum Verwenden. Ich muss es selbst tun.

R. White
quelle

Antworten:

11

Sie haben eine sogenannte intermittierende Nachfrage , dh eine Nachfragezeitreihe, die durch "viele" Nullen gekennzeichnet ist. (Wenn Ihre Zeitreihe per se nicht nachgefragt wird, gilt das meiste der folgenden Punkte weiterhin.) Eine Websuche nach "Prognose des intermittierenden Bedarfs" wäre also bereits hilfreich. Teunter und Duncan (2009, JORS) geben einen Überblick über Methoden zur intermittierenden Bedarfsprognose.

Die Standardmethode zur Vorhersage intermittierender Anforderungen ist die Croston-Methode. Verwenden Sie die exponentielle Glättung in Intervallen zwischen Anforderungen und bei Bedarfsgrößen ungleich Null separat . Die Punktprognose ist dann das Verhältnis des geglätteten Bedarfs ungleich Null zum geglätteten Intervall zwischen Anforderungen. Syntetos und Boylan (2001, IJPE) stellen fest, dass Croston leicht voreingenommen ist und eine Modifikation vorschlägt, aber dies macht in der Praxis normalerweise keinen großen Unterschied.

Eine Alternative sind integer autoregressive Moving Average-Modelle (INARMA), die die Standard-ARIMA-Zeitreihenmodelle modifizieren. Maryam Mohammadipour hat eine These dazu geschrieben .

Ich persönlich habe große Zweifel an der Nützlichkeit einer solchen Erwartungspunktprognose. Eine Zeitreihe von 1 Bedarf in jedem zweiten Zeitraum hat eine Erwartung von 0,5 ... ebenso wie eine Zeitreihe von 2 Anforderungen in jedem vierten Zeitraum ... und so weiter - obwohl dies natürlich immer weniger Poisson-y ist . Ich würde argumentieren, dass es viel nützlicher ist, die gesamte zukünftige (und vorausschauende) Verteilung der Anforderungen zu verstehen. Ich begrüße Ihre Suche nach Vorhersageintervallen!

α(n- -2)y^λ=y^

Shenstone und Hyndman (2005, JoF) stellen fest, dass es kein konsistentes stochastisches Modell gibt, für das Crostons Methode optimal wäre - alle Kandidatenmodelle sind (1) kontinuierlich, nicht diskret und (2) können negative Werte ergeben. Für diese Kandidatenmodelle stellen Shenstone und Hyndman jedoch Vorhersageintervalle bereit.

Abschließend noch ein Wort der Vorsicht: nicht verwenden , um den MAD für die Beurteilung der Genauigkeit der Prognosen Zähldaten, schon gar nicht für die intermittierenden Anforderungen. Der erwartete MAD wird durch den Median Ihrer zukünftigen Verteilung minimiert , nicht durch den Mittelwert . Wenn Sie schreiben, dass 65% Ihrer Daten Nullen sind, ist der Median Null ... was bedeutet, dass Sie wahrscheinlich den niedrigsten MAD durch eine Wohnung erhalten Null-Prognose, die stark voreingenommen und wahrscheinlich nutzlos ist. Hier ist eine Präsentation, die ich letztes Jahr auf dem Internationalen Symposium für Prognosen zu diesem Thema gehalten habe. Oder schauen Sie sich Morlidge (2015, Foresight) an .

Letztes Stück schamloser Eigenwerbung: Ich habe einen Artikel in der IJF (Kolassa, 2016), der sich mit der Vorhersage von Daten mit geringer Volumenzahl (meist intermittierend), verschiedenen Genauigkeitsmaßen und verschiedenen Prognosemethoden befasst, einschließlich verschiedener Arten von Poisson-Modellen. Dies kann für Sie nützlich sein.

Stephan Kolassa
quelle
1
Danke für die Reaktion Stephan. Sie geben mir viel neues Wissen und Erkenntnisse, ich drehe mich komplett um. Ich hätte sehr gerne ein PDF Ihres Manuskripts, ich denke, es wäre wirklich hilfreich
R. White
1
Eine andere Frage, wenn es Ihnen nichts ausmacht. In diesem Artikel wird beschrieben, wie ich die Intermittenz meiner Daten testen soll. Jetzt stelle ich fest, dass viele Mediane qipro Gruppe einen Wert von 1 haben. Ein niedrigerer Wert ist nicht wirklich möglich, sodass davon ausgegangen werden kann, dass die meisten meiner Gruppen nicht intermittierend sind, oder?
R. White
1
Diese Klassifizierung ist für mich neu. Es ist sicherlich nicht üblich in der akademischen Literatur. Ich kenne jedoch die Autoren dieses SAS-Papiers und sie wissen normalerweise, was sie tun. Ich würde empfehlen, dass Sie intermittierende und nicht intermittierende Methoden für Ihre Daten ausprobieren und herausfinden, welche am besten funktionieren. Überprüfen Sie dann, ob dies mit den im SAS-Dokument angegebenen Kriterien zu tun hat. Syntetos & Boylan (2005) und Boylan et al. (2008) geben alternative Klassifikationen an.
Stephan Kolassa
3
Intermittierende Anforderungen sind schwer vorherzusagen. Das Problem ist, dass der Unterschied zwischen Nullnachfrage und Nicht-Null-Nachfrage (relativ!) Groß ist - und dass wir normalerweise nicht wissen, wann die Nicht-Null-Nachfrage auftreten wird. Ich schlage vor, dass Sie einige Simulationen durchführen. Simulieren Sie Poisson-Zufallsvariablen und überprüfen Sie, welchen RMSE Sie erhalten, wenn Sie die (bekannte!) Erwartung vorhersagen. Dies simuliert die Situation, in der Sie wissen, wie hoch die durchschnittliche Nachfrage ist , aber nicht wissen, wann die Nachfrage auftreten wird. Sie werden wahrscheinlich feststellen, dass RMSEs ziemlich groß sind.
Stephan Kolassa
2
tt+1