Was sind die Stationaritätsanforderungen für die Verwendung der Regression mit ARIMA-Fehlern (dynamische Regression) zur Inferenz?
Insbesondere habe ich eine instationäre kontinuierliche Ergebnisvariable , eine instationäre kontinuierliche Prädiktorvariable und eine Scheinvariablen-Behandlungsserie . Ich würde gerne wissen, ob die Behandlung mit einer Änderung der Ergebnisvariablen korreliert war, die mehr als zwei Standardfehler von der Null-Änderung entfernt ist.
Ich bin nicht sicher, ob ich diese Reihen unterscheiden muss, bevor ich die Regression mit ARIMA-Fehlermodellierung durchführe. In einer Antwort auf eine andere Frage gibt IrishStat an, dass while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.
er das dann hinzufügt unwarranted usage [of differencing] can create statistical/econometric nonsense
.
Das SAS-Benutzerhandbuch schlägt vor, dass es in Ordnung ist, Regressionsmodelle mit ARIMA-Fehlern an instationäre Reihen anzupassen, ohne Unterschiede zu machen, solange die Residuen instationär sind:
Beachten Sie, dass das Erfordernis der Stationarität für die Rauschreihen gilt. Wenn keine Eingangsvariablen vorhanden sind, sind die Antwortreihen (nach Differenzierung und minus dem Mittelwert) und die Rauschreihen gleich. Wenn es jedoch Eingänge gibt, ist die Rauschreihe der Rest, nachdem der Effekt der Eingänge entfernt wurde.
Es ist nicht erforderlich, dass die Eingangsreihe stationär ist. Wenn die Eingänge nicht stationär sind, ist die Antwortserie nicht stationär, obwohl der Rauschprozess möglicherweise stationär ist.
Wenn nichtstationäre Eingabereihen verwendet werden, können Sie die Eingabevariablen zunächst ohne ARMA-Modell für die Fehler anpassen und dann die Stationarität der Residuen berücksichtigen, bevor Sie ein ARMA-Modell für den Rauschanteil identifizieren.
Auf der anderen Seite behaupten Rob Hyndman & George Athanasopoulos :
Ein wichtiger Gesichtspunkt bei der Schätzung einer Regression mit ARMA-Fehlern ist, dass alle Variablen im Modell zuerst stationär sein müssen. Wir müssen also zunächst prüfen, ob yt und alle Prädiktoren stationär erscheinen. Wenn wir das Modell schätzen, während eines davon nicht stationär ist, können die geschätzten Koeffizienten falsch sein.
Eine Ausnahme bildet der Fall, in dem nichtstationäre Variablen mitintegriert werden. Wenn zwischen dem nicht stationären und den stationären Prädiktoren eine Linearkombination besteht, sind die geschätzten Koeffizienten korrekt.
Schließen sich diese Ratschläge gegenseitig aus? Wie soll der angewandte Analyst vorgehen?
Antworten:
Meine Lektüre des SAS-Textes entspricht Hyndman und Athansopoulos.
Kurzum: Gehen Sie mit Hyndman und Athansopoulos.
In den ersten beiden Absätzen des SAS-Textes scheint es sich nur um eine Regression ohne ARMA zu handeln.
Der letzte Absatz des SAS-Textes scheint dem letzten Absatz von Hyndman und Athansolpoulos zu entsprechen.
Zu dem Kommentar: "Unberechtigter Gebrauch kann zu statistischem / ökonometrischem Unsinn führen"
Ich vermute, dass dies anders ist, wenn es keine Einheitswurzel gibt.
In Bezug auf den Kommentar: "Während die Originalserien keine Stationarität aufweisen, impliziert dies nicht notwendigerweise, dass in einem Kausalmodell eine Differenzierung erforderlich ist."
Ich denke, dass dies im Einklang mit dem zweiten Absatz von Hyndman und Athansopoulos steht.
Beachten Sie, dass wir bisher nicht-saisonale Unterschiede besprochen haben. Es gibt auch saisonale Unterschiede. Dafür gibt es Tests wie OCSB, HEGY und Kunst (1997). Ich erinnere mich, dass D. Osborne einmal schrieb, es sei besser, saisonal zu differenzieren, wenn eine Zeitreihe "auf dem Höhepunkt" stehe.
Zusammenfassend sollte dies Ihr Ansatz sein:
quelle
Laut David Giles "ist es eine konservative, aber relativ sichere Methode, alles zu differenzieren, wenn Sie bei den Tests, mit denen Sie auf Stationarität / Nichtstationarität getestet haben, zu einer falschen Schlussfolgerung gekommen sind. Sie müssen nicht unabsichtlich scheitern." eine Variable zu differenzieren, die I (1) ist. Die "Kosten" hierfür sind erheblich. Andererseits verursacht das unnötige Differenzieren einer Variablen, die tatsächlich I (0) ist, relativ niedrige "Kosten". http://davegiles.blogspot.com/2015/04/question-from-reader.html
quelle