Angenommen, ich habe eine Zeitreihe , die ich mit einem ARIMA (1,1,0) -Modell des Formulars anpassen möchte:
Dies könnte wie folgt umgeschrieben werden:
Die letzte Gleichung beschreibt ein AR (2) -Modell mit den Koeffizienten und . Ich erkenne, dass dieses AR (2) -Modell abhängig von möglicherweise nicht stationär ist. Wenn ich jedoch zunächst ein Diff genommen habe, sollte die Serie, die ich modelliere, nicht stationär sein.
Ich weiß, dass wenn das Modell nicht stationär ist, ein Diff verwendet werden sollte. Aber wie würden sich die Ergebnisse unterscheiden, wenn ich ein AR (2) -Modell gegenüber einem ARIMA (1,1,0) -Modell verwenden würde? Ich gehe davon aus (wie von R angedeutet), dass es ein Problem mit der Konvergenz gibt. Wenn ich jedoch R auffordere, die Anpassungen durchzuführen, werden beide ausgeführt, und die Koeffizienten stimmen (meistens) mit meinen obigen Beobachtungen überein. Die Prognosen sind jedoch definitiv anders.
Wenn jemand etwas Licht ins Dunkel bringen oder mich auf eine gute Referenz hinweisen könnte, würde ich es begrüßen.
Hier ist der R-Code, mit dem ich beide Modelle generiert habe.
> set.seed(2)
> x <- arima.sim(n = 1000, model=list(order=c(1,1,0), ar=c(0.3)))
> plot(x)
> arima(x, order=c(1,1,0))
Call:
arima(x = x, order = c(1, 1, 0))
Coefficients:
ar1
0.3291
s.e. 0.0298
sigma^2 estimated as 1.03: log likelihood = -1433.91, aic = 2871.81
> arima(x, order=c(2,0,0))
Call:
arima(x = x, order = c(2, 0, 0))
Coefficients:
ar1 ar2 intercept
1.3290 -0.3294 50.9803
s.e. 0.0298 0.0299 35.9741
sigma^2 estimated as 1.03: log likelihood = -1438.93, aic = 2885.86
Warning messages:
1: In log(s2) : NaNs produced
2: In log(s2) : NaNs produced
3: In log(s2) : NaNs produced
4: In arima(x, order = c(2, 0, 0)) :
possible convergence problem: optim gave code = 1
quelle
Antworten:
Die Prognose für die ARIMA (1,1,0) erzwingt die Einschränkung, dass .d=1
Es ist vielleicht noch einfacher in dem AR zu sehen (1) vs. ARIMA (0,1,0) Fall: Letzteres ist nur der optimalen Prognosen 0 bei allen Horizonten (wir erwarten nehmen der Wert Null). Wenn wir selbst prognostizieren , nehmen wir den letzten Stichprobenwert und akkumulieren nur die prognostizierten Änderungen von . Grundsätzlich erwarten wir, dass der Wert von morgen der Wert von heute plus die erwartete Änderung von heute zu morgen ist.
Da wir hier keine Änderungen erwarten, ist die optimale Vorhersage für einen solchen zufälligen Spaziergang ( ist die letzte in der Stichprobenbeobachtung) für alle .yT T h=T+1,…
Wenn wir andererseits ein AR (1) -Modell anpassen, erhalten wir eine Schätzung und erzeugen die optimalen Vorhersagen aus einem AR (1) -Modell als Wenn Schätzfehler (wie sie im Allgemeinen in endlichen Stichproben auftreten) so sind, dass vom wahren Wert 1 abweicht, unterscheiden sich die Prognosen.α^
quelle
Die Äquivalenz hängt von den Definitionen ab. Der allgemeine ARMA (p, q) -Prozess kann als stochastischer Prozess definiert werden, der die Lösung für die folgende Gleichung darstellt:
wobei ein Prozess mit weißem Rauschen ist. Wir müssen verlangen, dass Polynome und keine gemeinsamen Wurzeln haben sollten Reihenfolge, in der die Gleichung eindeutig definiert wird.Zt ϕ(z)=1−ϕ1z−...−ϕpzp θ(z)=1+θ1z+...θpzp
Nun stellt sich die Frage, wann diese Gleichung eine Lösung hat. Die Antwort beruht auf den Eigenschaften der Polynome und . Die Gleichung hat eine stationäre Lösung, wenn Polynome keine Wurzeln auf dem Einheitskreis haben.ϕ(z) θ(z)
In diesem Sinne ist ARIMA (1,1,0) kein AR (2) -Prozess, weil es nicht stationär ist. Es kann so geschrieben werden, dass es die AR (2) -Gleichung erfüllt, aber da die Polynome eine Wurzel auf einem Einheitskreis haben, können Sie die Gleichung nicht lösen. Wenn jedoch das Polynom eine Einheitswurzel hat, erfüllt die ARMA-Gleichung (p-1, q) (mit verschiedenen Polynomen). Es ist also möglich, nach zu lösen und zu . Um diesen Unterschied zu kennzeichnen, wird die ARIMA-Notation (p, d, q) verwendet.ϕ(z) ΔXt ΔXt Xt
Zusammenfassend lässt sich sagen, dass ARIMA (1,1,0) und AR (2) nicht äquivalent sind, wenn wir einen ARMA (p, q) -Prozess streng als stationäre Lösung der ARMA (p, q) -Gleichung definieren.
Die Tatsache, dass R es schafft, die richtigen Koeffizienten zu finden, ist eine interessante Eigenschaft der Schätzung, dh es kann gezeigt werden, dass im Fall von Einheitswurzeln das OLS [1] konsistente Schätzungen der Koeffizienten liefert, die Inferenz jedoch falsch wäre , da die Grenzverteilungen nicht normal sind. Die ADF-Tests basieren auf solchen Schätzungen. Die tatsächliche Mathematik, um zu zeigen, dass die Schätzungen in Ordnung sind, ist jedoch ziemlich kompliziert und beruht auf bestimmten Annahmen. Diese Annahmen lassen sich nicht gut verallgemeinern, daher ist es nicht ratsam, übliche Schätzmethoden für Einheitswurzelprozesse zu verwenden.
[1] MLE und OLS entsprechen den AR (p) -Typspezifikationen.
quelle