Wie kann man SARIMAX intuitiv verstehen?

26

Ich versuche, ein Papier über die Vorhersage der elektrischen Last zu verstehen, aber ich kämpfe mit den darin enthaltenen Konzepten, insbesondere dem SARIMAX- Modell. Dieses Modell dient der Vorhersage der Auslastung und verwendet viele statistische Konzepte, die ich nicht verstehe (ich bin Student der Informatik - Sie können mich als Laie in der Statistik bezeichnen). Es ist nicht notwendig, dass ich vollständig verstehe, wie es funktioniert, aber ich möchte zumindest intuitiv verstehen, was passiert.

Ich habe versucht, SARIMAX in kleinere Teile aufzuteilen und zu versuchen, jedes dieser Teile einzeln zu verstehen und sie dann zusammenzufügen. Könnt ihr mir helfen? Folgendes habe ich bisher.

Ich habe mit AR und MA angefangen.

AR : Autoregressiv . Ich habe gelernt, was eine Regression ist, und nach meinem Verständnis beantwortet sie einfach die Frage: Wie kann ich bei einer Reihe von Werten / Punkten ein Modell finden, das diese Werte erklärt? So haben wir zum Beispiel die lineare Regression, die versucht, eine Linie zu finden, die all diese Punkte erklären kann. Eine Autoregression ist eine Regression, die versucht, die Werte anhand ihrer vorherigen Werte zu erklären.

MA : Gleitender Durchschnitt . Ich bin hier eigentlich ziemlich verloren. Ich weiß, was ein gleitender Durchschnitt ist, aber das Modell des gleitenden Durchschnitts scheint nichts mit dem "normalen" gleitenden Durchschnitt zu tun zu haben. Die Formel für das Modell ähnelt der von AR und ich kann anscheinend keines der Konzepte verstehen, die ich im Internet finde. Was ist der Zweck von MA? Was ist der Unterschied zwischen MA und AR?

Jetzt haben wir also ARMA. Das Ich kommt dann von Integriert , was, soweit ich es verstanden habe, einfach dazu dient, dem ARMA-Modell eine Tendenz zu geben, entweder zuzunehmen oder abzunehmen. (Entspricht dies der Aussage, dass ARIMA es zulässt, nicht stationär zu sein?)

Jetzt kommt das S von saisonal , was die Periodizität von ARIMA erhöht. Dies besagt im Grunde genommen, zum Beispiel im Fall von Lastprognosen, dass die Last jeden Tag um 18 Uhr sehr ähnlich aussieht.

Schließlich das X aus exogenen Variablen, mit dem externe Variablen im Modell berücksichtigt werden können, z. B. Wettervorhersagen.

So haben wir endlich SARIMAX! Sind meine Erklärungen in Ordnung? Beachten Sie, dass diese Erklärungen nicht unbedingt korrekt sein müssen. Kann mir jemand erklären, was MA intuitiv macht?

Zusammenstoß
quelle
6
Ihre Intuition, dass das Moving Average-Modell nichts mit dem "normalen" Moving Average zu tun zu haben scheint, ist solide. Siehe zum Beispiel: Warum werden MA (q) Zeitreihenmodelle als „gleitende Durchschnitte“ bezeichnet?
Graeme Walsh

Antworten:

15

Wie Sie bemerkt haben, (1) bezieht ein AR-Modell den Wert einer Beobachtung zum Zeitpunkt mit einem gewissen Fehler auf die vorherigen Werte: Setzen wir und dann : Unendlich : Sie können jedes (stationäre) AR schreiben (t x t = ϕ x t - 1 + ε t x t - 1 x t - 2 x txt

xt=ϕxt1+εt
xt1xt2 xt=φnxt-n+φn-1εt-n+1+. . . +ϕεt-1+εtp
xt=ϕ(ϕxt2+εt1)+εt=ϕ2xt2+ϕεt1+εt=ϕ3xt3+ϕ2εt2+ϕεt1+εt
xt=ϕnxtn+ϕn1εtn+1+...+ϕεt1+εt
p ) als MA ( ), obwohl Sie natürlich mit p > 1 auf eine riesige Anhäufung von Begriffen stoßen .p>1

Nachdem wir das gesehen haben, wollen wir unsere Definition (1) jetzt umformulieren. Ein AR-Prozess verknüpft den Wert einer Beobachtung zum Zeitpunkt t mit einer unendlichen Folge abklingender Fehlerschocks ε aus früheren Zeiträumen (die wir nicht direkt beobachten).xt ε

qxtq

θ1...θqqqxtx

xtxtxt1

Affine
quelle
Hallo Affine, danke für die schnelle Antwort! Kann ich sagen, MA ist wie ein AR für den Fehler?
Clash
pq