MAD = Mittlere absolute Abweichung MSE = Mittlerer quadratischer Fehler
Ich habe Vorschläge von verschiedenen Stellen gesehen, dass MSE trotz einiger unerwünschter Eigenschaften verwendet wird (z. B. http://www.stat.nus.edu.sg/~staxyc/T12.pdf , das auf Seite 8 heißt. "Es wird allgemein angenommen, dass MAD ist ein besseres Kriterium als MSE. Mathematisch ist MSE jedoch praktischer als MAD. ")
Gibt es mehr als das? Gibt es ein Dokument, das gründlich analysiert, in welchen Situationen verschiedene Methoden zur Messung von Prognosefehlern mehr oder weniger geeignet sind? Meine Google-Suche hat nichts ergeben.
Eine ähnliche Frage wurde unter /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde gestellt , und der Benutzer wurde dazu aufgefordert poste auf stats.stackexchange.com, aber ich glaube nicht, dass sie es jemals getan haben.
quelle
Antworten:
Um zu entscheiden, welches Punktprognosefehlermaß verwendet werden soll, müssen wir einen Schritt zurückgehen. Beachten Sie, dass wir das zukünftige Ergebnis nicht genau kennen und es auch niemals wissen werden. Das zukünftige Ergebnis folgt also einer Wahrscheinlichkeitsverteilung . Einige Prognosemethoden geben eine solche vollständige Verteilung explizit aus, andere nicht - sie ist jedoch immer vorhanden, wenn auch nur implizit.
Jetzt wollen wir ein gutes Fehlermaß für eine Punktvorhersage haben . Eine solche Punktprognose ist unser Versuch, das, was wir über die zukünftige Verteilung (dh die prädiktive Verteilung) zum Zeitpunkt wissen, unter Verwendung einer einzigen Zahl, einem sogenannten Funktional der zukünftigen Dichte, zusammenzufassen. Das Fehlermaß ist dann eine Möglichkeit, die Qualität dieser einzelnen Zahlenzusammenfassung zu bewerten.Ft t
Wählen Sie daher ein Fehlermaß, das "gute" Zusammenfassungen (unbekannter, möglicherweise prognostizierter, möglicherweise aber nur impliziter) zukünftiger Dichten liefert.
Die Herausforderung besteht darin, dass unterschiedliche Fehlermaßnahmen durch unterschiedliche Funktionen minimiert werden. Der erwartete MSE wird durch den erwarteten Wert der zukünftigen Ausschüttung minimiert . Die erwartete MAD wird durch den Median der zukünftigen Verteilung minimiert . Wenn Sie also Ihre Prognosen kalibrieren, um die MAE zu minimieren, ist Ihre Punktprognose der zukünftige Median und nicht der zukünftige Erwartungswert, und Ihre Prognosen sind voreingenommen, wenn Ihre zukünftige Verteilung nicht symmetrisch ist.
Dies ist am relevantesten für Zähldaten, die normalerweise schief sind. In extremen Fällen (z. B. bei Poisson-Umsätzen mit einem Mittelwert unter ) ist Ihr MAE für eine Prognose von Null niedrig. Sehen Sie hier oder hier oder hier für Details.Log2 ≈ 0,69
Ich gebe einige weitere Informationen und eine Illustration in Was sind die Mängel des Mean Absolute Percentage Error (MAPE)? Dieser Thread berücksichtigt die Map , aber auch andere Fehlermaßnahmen und enthält Links zu anderen verwandten Threads.
Welches Fehlermaß tatsächlich verwendet wird, hängt letztendlich von Ihren Prognosekosten ab, dh von der Art des Fehlers, der am schmerzhaftesten ist. Ohne die tatsächlichen Auswirkungen von Prognosefehlern zu betrachten, ist jede Diskussion über "bessere Kriterien" im Grunde bedeutungslos.
Vor einigen Jahren waren Messungen der Prognosegenauigkeit ein großes Thema in der Prognosegemeinschaft, und sie tauchen immer noch ab und zu auf. Ein sehr guter Artikel ist Hyndman & Koehler "Ein weiterer Blick auf Messungen der Prognosegenauigkeit" (2006).
Schließlich besteht eine Alternative darin, die vollständigen Vorhersagedichten zu berechnen und diese unter Verwendung geeigneter Bewertungsregeln zu bewerten .
quelle
Die Vorteile der Verwendung von MAE anstelle von MSE werden in Davydenko und Fildes (2016) erläutert , siehe Abschnitt 3.1:
Verweise
Davydenko, A. & Fildes, R. (2016). Prognosefehlermaßnahmen: Kritische Überprüfung und praktische Empfehlungen. In Business Forecasting: Praktische Probleme und Lösungen. John Wiley & Söhne
quelle
Tatsächlich,
Wenn der RMSE nahe am MAE liegt, gibt es viele kleine Abweichungen. Wenn er nahe an der Obergrenze liegt, gibt es nur wenige grob falsche Vorhersagen.
quelle