Verständnis des k-Lag im erweiterten Dickey-Fuller-Test von R.

15

Ich habe mit einigen Unit-Root-Tests in R herumgespielt und bin mir nicht ganz sicher, was ich mit dem Parameter k lag anfangen soll. Ich habe den erweiterten Dickey-Fuller-Test und den Philipps-Perron-Test aus dem tseries- Paket verwendet. Offensichtlich hängt der voreingestellte Parameter (für ) nur von der Länge der Reihe ab. Wenn ich verschiedene Werte wähle, erhalte ich ziemlich unterschiedliche Ergebnisse. Null ablehnen:kadf.testk

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

plus das PP-Testergebnis:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

Wenn ich mir die Daten anschaue, würde ich denken, dass die zugrunde liegenden Daten nicht stationär sind, aber ich halte diese Ergebnisse dennoch nicht für ein starkes Backup, insbesondere da ich die Rolle des Parameters nicht verstehe . Wenn ich auf decompose / stl schaue, sehe ich, dass der Trend starke Auswirkungen hat, im Gegensatz zu nur geringen Beiträgen von Rest- oder saisonalen Schwankungen. Meine Serie erscheint vierteljährlich.k

Irgendwelche Hinweise?

hans0l0
quelle
3
Dieses Buch sollte alle Ihre Fragen beantworten.
mpiktas
1
Vielen Dank! Ich liebe die Springer useR-Serie, aber ich kannte diese nicht ...
hans0l0
hmm, iiuc diese testen nur, ob phi = 1 ist, nicht, wenn phi> 1. Trotzdem sagt der R-Ausgang, die Alternative sei: Stationarität. Prüfen sie also auch phi> 1? Offensichtlich wäre das auch nicht stationär.
hans0l0

Antworten:

5

Es ist schon eine Weile her, dass ich mir ADF-Tests angesehen habe, aber ich erinnere mich an mindestens zwei Versionen des ADF-Tests.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

Das fUnitRoots-Paket verfügt über eine Funktion namens adfTest (). Ich denke, dass das Thema "Trend" in diesen Paketen anders gehandhabt wird.

Bearbeiten ------ Ab Seite 14 des folgenden Links gab es 4 Versionen (uroot Discontinued) des ADF-Tests:

http://math.uncc.edu/~zcai/FinTS.pdf

Noch ein Link. Lesen Sie Abschnitt 6.3 unter folgendem Link. Es macht einen weitaus besseren Job, als ich es tun könnte, um den Verzögerungsbegriff zu erklären:

http://www.yats.com/doc/cointegration-en.html

Auch wäre ich mit jedem Saisonmodell vorsichtig. Sofern Sie sich nicht sicher sind, ob eine gewisse Saisonalität vorliegt, würde ich die Verwendung saisonaler Begriffe vermeiden. Warum? Alles kann saisonal unterteilt werden, auch wenn dies nicht der Fall ist. Hier sind zwei Beispiele:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

Die folgende Grafik stammt aus der obigen Plot-Anweisung (x.stl). stl () hat einen kleinen saisonalen Begriff für weißes Rauschen gefunden. Man könnte sagen, dass dieser Begriff so klein ist, dass es wirklich kein Problem ist. Das Problem ist, dass Sie in realen Daten nicht wissen, ob dieser Begriff ein Problem ist oder nicht. Beachten Sie im folgenden Beispiel, dass die Trenddatenreihe Segmente aufweist, in denen sie wie eine gefilterte Version der Rohdaten aussieht, und andere Segmente, in denen sie möglicherweise als wesentlich anders als die Rohdaten angesehen wird.

Bildbeschreibung hier eingeben

bill_080
quelle
1

Der k-Parameter ist ein Satz von Verzögerungen, die zur Adressenserienkorrelation hinzugefügt werden. Das A in ADF bedeutet, dass der Test durch das Hinzufügen von Verzögerungen erweitert wird. Die Auswahl der Anzahl der Verzögerungen im ADF kann auf verschiedene Arten erfolgen. Ein üblicher Weg besteht darin, mit einer großen Anzahl von Verzögerungen zu beginnen, die a priori ausgewählt wurden, und die Anzahl der Verzögerungen nacheinander zu verringern, bis die längste Verzögerung statistisch signifikant ist.

Sie können die Serienkorrelation der Residuen testen, nachdem Sie die Verzögerungen im ADF angewendet haben.

RAH
quelle