Ich habe mit einigen Unit-Root-Tests in R herumgespielt und bin mir nicht ganz sicher, was ich mit dem Parameter k lag anfangen soll. Ich habe den erweiterten Dickey-Fuller-Test und den Philipps-Perron-Test aus dem tseries- Paket verwendet. Offensichtlich hängt der voreingestellte Parameter (für ) nur von der Länge der Reihe ab. Wenn ich verschiedene Werte wähle, erhalte ich ziemlich unterschiedliche Ergebnisse. Null ablehnen:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
plus das PP-Testergebnis:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Wenn ich mir die Daten anschaue, würde ich denken, dass die zugrunde liegenden Daten nicht stationär sind, aber ich halte diese Ergebnisse dennoch nicht für ein starkes Backup, insbesondere da ich die Rolle des Parameters nicht verstehe . Wenn ich auf decompose / stl schaue, sehe ich, dass der Trend starke Auswirkungen hat, im Gegensatz zu nur geringen Beiträgen von Rest- oder saisonalen Schwankungen. Meine Serie erscheint vierteljährlich.
Irgendwelche Hinweise?
quelle
Antworten:
Es ist schon eine Weile her, dass ich mir ADF-Tests angesehen habe, aber ich erinnere mich an mindestens zwei Versionen des ADF-Tests.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
Das fUnitRoots-Paket verfügt über eine Funktion namens adfTest (). Ich denke, dass das Thema "Trend" in diesen Paketen anders gehandhabt wird.
Bearbeiten ------ Ab Seite 14 des folgenden Links gab es 4 Versionen (uroot Discontinued) des ADF-Tests:
http://math.uncc.edu/~zcai/FinTS.pdf
Noch ein Link. Lesen Sie Abschnitt 6.3 unter folgendem Link. Es macht einen weitaus besseren Job, als ich es tun könnte, um den Verzögerungsbegriff zu erklären:
http://www.yats.com/doc/cointegration-en.html
Auch wäre ich mit jedem Saisonmodell vorsichtig. Sofern Sie sich nicht sicher sind, ob eine gewisse Saisonalität vorliegt, würde ich die Verwendung saisonaler Begriffe vermeiden. Warum? Alles kann saisonal unterteilt werden, auch wenn dies nicht der Fall ist. Hier sind zwei Beispiele:
Die folgende Grafik stammt aus der obigen Plot-Anweisung (x.stl). stl () hat einen kleinen saisonalen Begriff für weißes Rauschen gefunden. Man könnte sagen, dass dieser Begriff so klein ist, dass es wirklich kein Problem ist. Das Problem ist, dass Sie in realen Daten nicht wissen, ob dieser Begriff ein Problem ist oder nicht. Beachten Sie im folgenden Beispiel, dass die Trenddatenreihe Segmente aufweist, in denen sie wie eine gefilterte Version der Rohdaten aussieht, und andere Segmente, in denen sie möglicherweise als wesentlich anders als die Rohdaten angesehen wird.
quelle
Der k-Parameter ist ein Satz von Verzögerungen, die zur Adressenserienkorrelation hinzugefügt werden. Das A in ADF bedeutet, dass der Test durch das Hinzufügen von Verzögerungen erweitert wird. Die Auswahl der Anzahl der Verzögerungen im ADF kann auf verschiedene Arten erfolgen. Ein üblicher Weg besteht darin, mit einer großen Anzahl von Verzögerungen zu beginnen, die a priori ausgewählt wurden, und die Anzahl der Verzögerungen nacheinander zu verringern, bis die längste Verzögerung statistisch signifikant ist.
Sie können die Serienkorrelation der Residuen testen, nachdem Sie die Verzögerungen im ADF angewendet haben.
quelle