Ich habe in diesem Sommer gelernt, wie man Prognosen erstellt, und ich habe Rob Hyndmans Buch Forecasting: Principles and Practice verwendet. Ich habe R verwendet, aber meine Fragen beziehen sich nicht auf Code. Bei den von mir verwendeten Daten habe ich festgestellt, dass eine durchschnittliche Prognose mehrerer Modelle zu höheren Genauigkeitsstufen geführt hat als jedes einzelne Modell für sich.
Kürzlich habe ich einen Blog gelesen, in dem es darum ging, Prognosemethoden zu mitteln und ihnen Gewichte zuzuweisen. Nehmen wir in meinem Fall an, ich ordne meinem Datensatz 11 verschiedene Modelle zu (Arima, ETS, Holt Winters, naiv, snaive usw.), und ich möchte einige davon mitteln, um eine Prognose zu erhalten. Hat jemand Erfahrung damit oder kann ich auf einen Artikel verweisen, der einen Einblick in die beste Vorgehensweise gibt?
Ab sofort verwende ich die Kreuzvalidierung und den mittleren absoluten Fehler, um herauszufinden, welche Modelle am besten und welche am schlechtesten abschneiden. Ich kann dies sogar verwenden, um die Top-Anzahl von Modellen zu identifizieren.
Ich denke meine Fragen sind
1) Wie viele Modelle würden Sie zur Auswahl vorschlagen? (2,3,4,5,6 usw.)
2) Irgendwelche Ideen zu Gewichten? (50% zum Besten, 25% zum Zweitbesten, 15% zum Drittbesten, 10% zum Viertbesten usw.)
3) Sind diese Prognosemodelle redundant und sollten nicht berücksichtigt werden? (Arima, snaive, naiv, HWs "Additiv", ETS, HoltWinters exponentielle Glättung, HoltWinters Glättung mit Trend, HoltWinters mit Trend / Saisonalität, multiple Regression)
Antworten:
Die Antworten auf Ihre Fragen in der richtigen Reihenfolge
Wie viele Modelle
Normalerweise so viele, wie Sie möchten, dies kann jedoch durch die Datenmenge begrenzt sein, über die Sie verfügen. Hängt auch von der Methode ab, mit der Sie die Gewichte ableiten (was ich weiter unten erläutere).
So weisen Sie Gewichte zu
Es gibt viele, hier sind die fünf beliebtesten auf meinem Kopf, obwohl keiner von ihnen den mittleren absoluten Fehler verwendet.
Sind die Prognosemodelle redundant / ausschließbar?
Die Holt-Winters-Modelle sind wahrscheinlich ähnlich, also werfen Sie vielleicht ein paar davon raus. Die Mittelung von Prognosen entspricht der Diversifizierung eines Finanzportfolios. Sie möchten, dass Ihre Modelle vielfältig sind. Bei einigen der oben genannten Mittelungstechniken schadet es nicht, redundante Modelle einzuschließen, bei anderen jedoch.
Sie können auch eine freundliche Einführung finden hier , mit paar mehr guten Möglichkeiten zur durchschnittlichen Prognosen (Constrained Least Squares zum Beispiel) zusammen mit einer R - Implementierung.
quelle
Souds wie ein Artikel über das Erstellen von Ensembles.
Die Anzahl der Modelle liegt in Ihrem eigenen Ermessen. Wenn ein prädiktiver Wert hinzugefügt wird, können Sie eine beliebige Anzahl von Modellen hinzufügen. Die Rechenzeit ist jedoch ein wichtiger Faktor. Aber wenn Sie 11 Modelle haben, würde ich zuerst sehen, ob ich die Korrelation zwischen den Modellen berechnen kann. Modelle mit einer hohen Korrelation fügen nicht viel hinzu. Sie sind besser dran, ein schlechteres, aber wenig korreliertes Modell hinzuzufügen.
Hier kommt es auch auf dein Urteilsvermögen an.
Alle Holtwinters-Modelle weisen eine hohe Korrelation miteinander auf. Vielleicht möchten Sie ein paar davon fallen lassen.
Ein guter Artikel über Ensembles wurde von MLWave geschrieben
quelle