Der Alpha-Parameter eines exponentiellen gleitenden Durchschnitts definiert die Glättung, die der Durchschnitt für eine Zeitreihe anwendet. In ähnlicher Weise definiert die Fenstergröße eines sich bewegenden Fenstermittels auch die Glättung.
Gibt es eine Möglichkeit, den Alpha-Parameter so einzustellen, dass die Glättung ungefähr der eines Mittelwerts für bewegliche Fenster einer bestimmten Größe entspricht? (Offensichtlich nicht nach identischen Ergebnissen suchen und Offsets sind in Ordnung). Sagen Sie also "Alpha so einstellen", dass die resultierende Zeitreihe so nah wie möglich an dem Ergebnis eines sich bewegenden 3-Monats-Fensters liegt?
edit : context: Ich versuche, aus Niederschlagsdaten, die abstrakt unterschiedliche Tiefen darstellen (von denen ich annehme, dass sie mit langfristigen Niederschlagsdurchschnitten zusammenhängen), mehrere Proxys für die Bodenfeuchtigkeit zu generieren. Ein sich bewegendes Fenster ermöglicht es mir, z. B. den Gesamtniederschlag in den letzten 3 Tagen, 3 Monaten oder dem Jahr zu berechnen, der den obersten Zentimetern des Bodens, dem obersten Meter bzw. der erweiterten Bodensäule entsprechen kann. Für ein sich bewegendes Fenster sind jedoch Daten aus der Vergangenheit erforderlich, die nicht immer verfügbar sind (z. B. zu Beginn einer Serie). Wenn stattdessen ein exponentieller Durchschnitt verwendet wird, muss ich nur einen Wert für jeden Durchschnitt speichern (den Durchschnitt aus dem vorherigen Zeitschritt), und dieser Wert kann mit dem langfristigen Mittelwert initialisiert werden.
Antworten:
Sei die ursprüngliche Zeitreihe und das Ergebnis der Glättung mit einem einfachen gleitenden Durchschnitt mit einer gewissen Fensterbreite. Sei eine Funktion, die eine geglättete Version von Verwendung des Glättungsparameters zurückgibt .x xm f(x,α) x α
Definieren Sie eine Verlustfunktion , die die Unähnlichkeit zwischen dem gleitenden gleitenden Durchschnitt und dem exponentiellen gleitenden Durchschnitt misst. Eine einfache Wahl wäre der quadratische Fehler:L
Wenn Sie möchten, dass der Fehler für die Verschiebung / Skalierung unveränderlich ist, können Sie so definieren , dass es so etwas wie das Negativ der Peakhöhe der normalisierten Kreuzkorrelation ist.L
Finden Sie den Wert von , der minimiert :α L
Hier ist ein Beispiel, bei dem ein verrauschtes sinusförmiges Signal und der mittlere quadratische Fehler als Verlustfunktion verwendet werden:
Ein weiteres Beispiel mit weißem Rauschen als Signal:
Die Verlustfunktion scheint sich gut zu verhalten und hat ein einziges globales Minimum für diese beiden unterschiedlichen Signale, was darauf hindeutet, dass ein Standard-1d-Optimierungslöser funktionieren könnte (wie ich hier habe). Aber ich habe nicht nachgewiesen , dass dies muss der Fall sein. Zeichnen Sie im Zweifelsfall die Verlustfunktion und verwenden Sie gegebenenfalls eine ausgefeiltere Optimierungsmethode.α
Bearbeiten :
Hier ist eine grafische Darstellung des optimalen Alphas (für die exponentielle Glättung) als Funktion der Fenstergröße (für den einfachen gleitenden Durchschnitt). Dargestellt für jedes der oben gezeigten Signale.
quelle
Wenn ich die Frage richtig verstehe, geht es darum, eine exponentiell abnehmende Gewichtsreihe an eine diskrete Uniform anzupassen (konstantes Gewicht mit Cutoff):
Offensichtlich nimmt entweder eine EWMA schnell ab (passt schlecht zu älteren Verzögerungen, bei denen der gewöhnliche gleitende Durchschnitt noch ein hohes Gewicht hat) oder hat einen Schwanz viel weiter in der Vergangenheit, der die Gewichtsverteilung schlecht passt, wenn der gewöhnliche gleitende Durchschnitt kein Gewicht hat).
Welche Wahl von am besten geeignet ist, um die Ergebnisse aus einheitlichen Gewichten abzugleichen, hängt entscheidend davon ab, wie Sie die Leistung messen und (natürlich) von den Eigenschaften der Serie (sowohl der gewöhnliche gleitende Durchschnitt als auch die EWMA wären nur für schwache Zwecke angemessen geeignet). stationäre Reihen zum Beispiel, aber das deckt viele Fälle mit möglicherweise unterschiedlicher relativer Leistung für unterschiedliche Werte ab.α α
Die Frage lässt diese beiden Dinge vage, daher vermute ich, dass nicht viel mehr zu sagen ist als "es kommt darauf an" - entweder über die Ähnlichkeit des bedingten Mittelwerts oder die Größe der bedingten Varianz hier.
quelle
Wir können uns dies als ein Problem der Hyperparameteroptimierung vorstellen.
Wir haben ein Ziel X_mean, das der Zielwert ist.
Wir haben auch eine Verlustfunktion, zB L2 (X_exponential - X_mean).
Wir suchen nach einem Hyperparameter (Alpha) für den exponentiellen gleitenden Durchschnitt, um den Verlust zu minimieren.
quelle