Der mittlere absolute Skalierungsfehler (MASE) ist ein Maß für die von Koehler & Hyndman (2006) vorgeschlagene Prognosegenauigkeit .
wobei ist der mittlere absolute Fehler der tatsächlichen Vorhersage erzeugt;
während M A E i n - s a m p l e ,
ist der mittlere absolute Fehler, der durch eine naive Prognose (z. B. unveränderte Prognose für eine integrierteI(1)-Zeitreihe) erzeugt wird und anhand der Stichprobendaten berechnet wird.
( Eine genaue Definition und Formel finden Sie in der Veröffentlichung von Koehler & Hyndman (2006) .)
bedeutetdass die tatsächliche Prognose tutschlimmeraus Probe als eine naive Prognose inProbe hatte, in Bezugdem mittleren absoluten Fehlers. Wenn also mittlere absolute Fehler die entsprechende Maß fürPrognosegenauigkeit ist (was das Problem beiHand hängt), M A S E > 1 legt nahedass die tatsächliche Prognose sollte zugunsten einer naiven Prognose verworfen werdenwenn wir die Out-of erwarten Die Stichprobendaten entsprechen weitgehend den Daten innerhalb der Stichprobe(da wir nur wissen, wie gut eine naive Prognose in der Stichprobe und nicht außerhalb der Stichprobe ausgeführt wurde).
Frage:
wurde als Benchmark in einem Prognosewettbewerb verwendet, der in diesemHyndsight-Blogbeitragvorgeschlagen wurde. Sollte ein offensichtlicher Maßstab nicht M A S E = 1 gewesen sein ?
Natürlich ist diese Frage nicht spezifisch für den jeweiligen Prognosewettbewerb. Ich möchte etwas Hilfe zum Verständnis in einem allgemeineren Kontext.
Meine Vermutung:
Die einzig vernünftige Erklärung, die ich sehe, ist, dass erwartet wurde, dass eine naive Prognose außerhalb der Stichprobe eine wesentlich schlechtere Leistung erbringt als in der Stichprobe, z. B. aufgrund eines Strukturwandels. Dann wäre möglicherweise zu schwierig gewesen.
Verweise:
- Hyndman, Rob J. und Anne B. Koehler. " Ein weiterer Blick auf Messungen der Prognosegenauigkeit. " International Journal of Forecasting 22.4 (2006): 679-688.
- Hyndsight-Blogbeitrag .
quelle
Antworten:
Rob Hyndman ruft im verlinkten Blog-Beitrag zur Teilnahme an einem Tourismus-Prognosewettbewerb auf. Im Wesentlichen dient der Blogbeitrag dazu, die Aufmerksamkeit auf den relevanten IJF-Artikel zu lenken, auf den in dem Blogbeitrag in einer ungekoppelten Version verwiesen wird.
Die Benchmarks, auf die Sie sich beziehen - 1,38 für monatliche, 1,43 für vierteljährliche und 2,28 für jährliche Daten - wurden anscheinend wie folgt ermittelt. Die Autoren (alle sind Experten für Prognosen und im IIF sehr aktiv - hier keine Schlangenölverkäufer) sind durchaus in der Lage, Standard-Prognosealgorithmen oder Prognosesoftware anzuwenden, und sie sind wahrscheinlich nicht an einer einfachen ARIMA-Einreichung interessiert. Also wandten sie einige Standardmethoden auf ihre Daten an. Damit der Gewinner zu einem Vortrag im IJF eingeladen wird werden kann, wird er gebeten, die besten dieser Standardmethoden, gemessen am MASE, zu verbessern.
Ihre Frage lautet also im Wesentlichen:
Hier kommt der 1.38 MASE aus Tabelle 4 in der ungated Version. Dies ist die durchschnittliche ASE-Prognose von ARIMA für einen Zeitraum von 1 bis 24 Monaten. Die anderen Standardmethoden wie ForecastPro, ETS usw. schneiden noch schlechter ab.
Daher würde ich sagen, dass Sie wahrscheinlich nicht viel dazu sagen können, ohne die Daten selbst zu betrachten. Sie sind bei Kaggle erhältlich. Ihre beste Wette besteht wahrscheinlich darin, diese 518-Serien zu nehmen, die letzten 24 Monate durchzuhalten, die ARIMA-Serien anzupassen, die MASEs zu berechnen, die zehn oder zwanzig schlechtesten MASE-Prognoseserien zu finden, eine große Kanne Kaffee zu trinken, diese Serien anzusehen und zu versuchen um herauszufinden, was ARIMA-Modelle so schlecht im Vorhersagen macht.
BEARBEITEN: Ein weiterer Punkt, der nachträglich offensichtlich erscheint, für den ich jedoch fünf Tage gebraucht habe. Denken Sie daran, dass der Nenner der MASE die stichprobenartige Prognose für den Schritt voraus ist , während der Zähler der Durchschnitt der 1-24-Schritte ist. vorausschauende Prognosen. Es ist nicht verwunderlich, dass sich die Prognosen mit zunehmendem Horizont verschlechtern. Dies könnte ein weiterer Grund für einen MASE von 1,38 sein. Beachten Sie, dass die saisonale naive Prognose ebenfalls in der Benchmark enthalten war und eine noch höhere MASE aufwies.
quelle
Keine Antwort, sondern eine Handlung nach dem Aufruf von Stephan Kolassa, sich diese Serien anzuschauen.
Kaggle tourism1 hat 518 jährliche Zeitreihen, für die wir die letzten 4 Werte vorhersagen wollen:
Die Zahlen in den Ecken, 81 12 ..., sind
Die 3 Reihen sind die 10 schlechtesten, 10 in der Mitte und 10 besten von 518 jährlichen Zeitreihen.
Offensichtlich sind sehr kurze Serien - 12 11 7 7 7 ... in der obersten Reihe - schwer vorherzusagen: keine Überraschung.
(Athanasopoulos, Hyndman, Song und Wu, The Tourism Forecasting Competition (2011, 23p) verwendeten 112 der 518 jährlichen Serien, aber ich sehe nicht, welche.)
Gibt es seit 2010 noch andere, neuere Sammlungen von Zeitreihen, die einen Blick wert sein könnten?
quelle