Ich arbeite an dem electricity
im R-Paket verfügbaren Datensatz TSA
. Mein Ziel ist es, herauszufinden, ob ein arima
Modell für diese Daten geeignet ist, und es schließlich anzupassen. Also ging ich wie folgt vor:
1. Zeichne die Zeitreihen auf, die sich aus der folgenden Grafik ergeben:
2. Ich wollte ein Logbuch electricity
zur Stabilisierung der Varianz erstellen und danach die Reihe entsprechend differenzieren, habe aber kurz zuvor die Stationarität auf der getestet Originaldatensatz unter Verwendung des adf
(Augmented Dickey Fuller) -Tests und überraschenderweise wie folgt:
Code und Ergebnisse:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Nun, nach der Vorstellung meines Anfängers von Zeitreihen bedeutet dies, dass die Daten stationär sind (kleiner p-Wert, Nullhypothese der Nichtstationarität ablehnen). Aber wenn ich mir die Handlung anschaue, finde ich keine Möglichkeit, dass dies stationär sein kann. Hat jemand eine gültige Erklärung dafür?
quelle
Antworten:
Da Sie den Standardwert von k in annehmenxt- xt - 1
adf.test
, der in diesem Fall 7 ist, testen Sie im Grunde genommen, ob der Informationssatz der letzten 7 Monate zur Erklärung von beiträgt . Der Stromverbrauch weist eine starke Saisonabhängigkeit auf, wie Ihr Grundstück zeigt, und dürfte über einen Zeitraum von sieben Monaten hinaus zyklisch sein. Wenn Sie k = 12 setzen und erneut testen, kann die Null der Einheitswurzel nicht verworfen werden.quelle
Unter der Annahme, dass "adf.test" tatsächlich aus dem Paket "tseries" stammt (direkt oder indirekt), liegt der Grund darin, dass es automatisch einen linearen Zeittrend enthält. Aus der tseries doc (Version 0.10-35): "Es wird die allgemeine Regressionsgleichung verwendet, die einen konstanten und einen linearen Trend enthält."
Ich stimme auch Pantera zu, dass die saisonalen Effekte das Ergebnis verfälschen könnten. Die Serie könnte in Wirklichkeit ein Zeittrend + deterministische Saisonale + stochastischer Einheitswurzelprozess sein, aber der ADF-Test könnte die saisonalen Schwankungen als stochastische Umkehrung des deterministischen Trends interpretieren, was bedeuten würde, dass die Wurzeln kleiner als eins sind. (Wenn Sie jedoch genügend Verzögerungen berücksichtigt haben, sollte dies eher als (unechte) Einheitswurzel bei saisonalen Frequenzen angezeigt werden, nicht bei der Null- / Langzeitfrequenz, auf die sich der ADF-Test bezieht Saisonmuster ist es besser, die Saisonzeiten einzuschließen.)
quelle