Ich habe eine Frage / Verwirrung über stationäre Reihen, die für die Modellierung mit ARIMA (X) benötigt werden. Ich denke darüber mehr in Bezug auf die Schlussfolgerung (Wirkung einer Intervention) nach, möchte aber wissen, ob Prognose und Schlussfolgerung einen Unterschied in der Reaktion bewirken.
Frage:
Alle einleitenden Ressourcen, die ich gelesen habe, besagen, dass die Serie stationär sein muss, was für mich sinnvoll ist und wo das "Ich" in arima (differenzierend) ankommt.
Was mich verwirrt, ist die Verwendung von Trends und Abweichungen in ARIMA (X) und die möglichen Auswirkungen auf stationäre Anforderungen.
Negiert die Verwendung eines konstanten / Drift-Terms und / oder einer Trendvariablen als exogene Variable (dh das Hinzufügen von 't' als Regressor) die Anforderung, dass die Reihe stationär ist? Ist die Antwort unterschiedlich, abhängig davon, ob die Serie eine Einheitswurzel (z. B. adf-Test) oder einen deterministischen Trend, aber keine Einheitswurzel hat?
ODER
Muss eine Serie vor der Verwendung von ARIMA (X) immer stationär sein, also durch Differenzieren und / oder Trennen?
quelle
Denken Sie daran, dass es verschiedene Arten der Nichtstationarität und unterschiedliche Arten des Umgangs mit ihnen gibt. Vier gebräuchliche sind:
1) Deterministische Trends oder Trendstationarität. Wenn es sich bei Ihrer Serie um eine solche Serie handelt, können Sie diese de-trendieren oder einen Zeittrend in die Regression / das Modell aufnehmen. Vielleicht möchten Sie den Frisch-Waugh-Lovell-Satz zu diesem Thema lesen.
2) Ebenenverschiebungen und Strukturbrüche. Wenn dies der Fall ist, sollten Sie für jede Pause eine Dummy-Variable einfügen, oder wenn Ihre Stichprobe lang genug ist, modellieren Sie jedes Regime separat.
3) Varianz ändern. Modellieren Sie die Stichproben entweder separat oder modellieren Sie die sich ändernde Varianz mit der Modellierungsklasse ARCH oder GARCH.
4) Wenn Ihre Serie eine Einheitswurzel enthält. Im Allgemeinen sollten Sie dann prüfen, ob die Beziehungen zwischen den Variablen zusammenwachsen. Da Sie sich jedoch mit univariaten Prognosen befassen, sollten Sie je nach Integrationsreihenfolge ein- oder zweimal differenzieren.
Um eine Zeitreihe mit der ARIMA-Modellierungsklasse zu modellieren, sollten die folgenden Schritte angemessen sein:
1) Betrachten Sie den ACF und den PACF zusammen mit einer Zeitreihendarstellung, um festzustellen, ob die Reihe stationär oder instationär ist.
2) Testen Sie die Serie auf eine Einheitswurzel. Dies kann mit einer Vielzahl von Tests durchgeführt werden, von denen einige am häufigsten der ADF-Test, der Phillips-Perron-Test (PP), der KPSS-Test mit dem Nullwert der Stationarität oder der DF-GLS-Test sind, der am effizientesten ist der oben genannten Tests. HINWEIS! Wenn Ihre Serie einen Strukturbruch enthält, werden diese Tests darauf ausgerichtet, die Null einer Einheitswurzel nicht abzulehnen. Wenn Sie die Robustheit dieser Tests testen möchten und einen oder mehrere Strukturbrüche vermuten, sollten Sie endogene Strukturbruchtests verwenden. Zwei gebräuchliche sind der Zivot-Andrews-Test, bei dem ein endogener Strukturbruch möglich ist, und der Clemente-Montañés-Reyes-Test, bei dem zwei Strukturbrüche möglich sind. Letzteres ermöglicht zwei verschiedene Modelle.
3) Wenn es eine Einheitswurzel in der Reihe gibt, sollten Sie die Reihe unterscheiden. Anschließend sollten Sie die ACF-, PACF- und Zeitreihendiagramme durchsehen und sicherheitshalber nach einer zweiten Einheitenwurzel suchen. Das ACF und das PACF helfen Ihnen bei der Entscheidung, wie viele AR- und MA-Begriffe Sie aufnehmen sollten.
4) Wenn die Serie keine Einheitswurzel enthält, aber das Zeitreihendiagramm und die ACF zeigen, dass die Serie einen deterministischen Trend aufweist, sollten Sie beim Anpassen des Modells einen Trend hinzufügen. Einige Leute argumentieren, dass es völlig richtig ist, die Reihe nur zu unterscheiden, wenn sie einen deterministischen Trend enthält, obwohl dabei Informationen verloren gehen können. Trotzdem ist es eine gute Idee, einen Unterschied zu machen, um zu sehen, wie viele AR- und / oder MA-Begriffe Sie aufnehmen müssen. Ein zeitlicher Trend ist jedoch gültig.
5) Passen Sie die verschiedenen Modelle an und führen Sie die üblichen diagnostischen Überprüfungen durch. Möglicherweise möchten Sie ein Informationskriterium oder die MSE verwenden, um das beste Modell für die Probe auszuwählen, auf die Sie es passen.
6) Machen Sie eine Stichprobenprognose für die am besten geeigneten Modelle und berechnen Sie Verlustfunktionen wie MSE, MAPE, MAD, um festzustellen, welche von ihnen bei der Prognose die beste Leistung erbringen, denn das möchten wir tun!
7) Machen Sie Ihre Out-of-Sample-Prognosen wie ein Boss und freuen Sie sich über Ihre Ergebnisse!
quelle
Die Bestimmung, ob der Trend (oder eine andere Komponente wie die Saisonalität) deterministisch oder stochastisch ist, ist Teil des Puzzles in der Zeitreihenanalyse. Ich werde ein paar Punkte zu dem hinzufügen, was gesagt wurde.
1) Die Unterscheidung zwischen deterministischen und stochastischen Trends ist wichtig, da dann, wenn eine Einheitswurzel in den Daten vorhanden ist (z. B. ein Zufallslauf), die für die Inferenz verwendeten Teststatistiken nicht der traditionellen Verteilung folgen. In diesem Beitrag finden Sie einige Details und Verweise.
Wir können einen zufälligen Gang simulieren (stochastischer Trend, bei dem die ersten Differenzen genommen werden sollten), die Signifikanz des deterministischen Trends testen und den Prozentsatz der Fälle ermitteln, in denen die Null des deterministischen Trends verworfen wird. In R können wir tun:
Bei einem Signifikanzniveau von 5% würden wir davon ausgehen, dass die Null in 95% der Fälle abgelehnt wird. In diesem Experiment wurde sie jedoch nur in ~ 89% der Fälle von 10.000 simulierten zufälligen Wanderungen abgelehnt.
Wir können Unit-Root-Tests anwenden , um zu testen, ob eine Unit-Root vorhanden ist. Wir müssen uns jedoch darüber im Klaren sein, dass ein linearer Trend wiederum dazu führen kann, dass die Null einer Einheitswurzel nicht zurückgewiesen wird. Um dies zu bewältigen, betrachtet der KPSS-Test den Nullpunkt der Stationarität um einen linearen Trend.
2) Ein weiteres Thema ist die Interpretation der deterministischen Komponenten in einem Prozess in Ebenen oder ersten Unterschieden. Der Effekt eines Abschnitts ist in einem Modell mit linearem Trend nicht der gleiche wie in einem zufälligen Schritt. Siehe diesen Beitrag zur Veranschaulichung.
Wir kommen zu:
Wenn die grafische Darstellung einer Reihe einen relativ deutlichen linearen Trend zeigt, können wir nicht sicher sein, ob dies auf das Vorhandensein eines deterministischen linearen Trends oder auf eine Drift in einem Zufallswandlungsprozess zurückzuführen ist. Ergänzende Grafiken und Teststatistiken sollten angewendet werden.
Es sind einige Vorsichtsmaßnahmen zu beachten, da eine Analyse auf der Basis der Einheitenwurzel und anderer Teststatistiken nicht narrensicher ist. Einige dieser Tests können durch abweichende Beobachtungen oder Pegelverschiebungen beeinflusst werden und erfordern die Auswahl einer Verzögerungsreihenfolge, die nicht immer einfach ist.
Als Problemumgehung für dieses Rätsel halte ich es für gängige Praxis, Datenunterschiede zu erfassen, bis die Reihe stationär aussieht (z. B. die Autokorrelationsfunktion, die schnell auf Null gehen sollte), und dann ein ARMA-Modell auszuwählen.
quelle
Sehr interessante Frage, ich würde auch gerne wissen, was andere zu sagen haben. Ich bin ausgebildeter Ingenieur und kein Statistiker, daher kann jemand meine Logik überprüfen. Da wir als Ingenieure gerne simulieren und experimentieren würden, war ich motiviert, Ihre Frage zu simulieren und zu testen.
Wie im Folgenden empirisch gezeigt, hat die Verwendung einer Trendvariablen in ARIMAX die Differenzierung aufgehoben und den Serientrend stationär gemacht. Hier ist die Logik, die ich verwendet habe, um zu überprüfen.
Unten ist der R-Code und die Zeichnungen:
AR (1) Simulierter Plot
AR (1) mit deterministischem Trend
ARIMAX Residual PACF mit Trend als exogen. Residulas sind zufällig und haben kein Muster mehr
Wie oben zu sehen ist, macht die Modellierung des deterministischen Trends als exogene Variable im ARIMAX-Modell eine Differenzierung überflüssig. Zumindest im deterministischen Fall hat es funktioniert. Ich frage mich, wie sich dies bei stochastischen Trends verhalten würde, die sich nur schwer vorhersagen oder modellieren lassen.
Um Ihre zweite Frage zu beantworten, müssen JA alle ARIMA einschließlich ARIMAX stationär gemacht werden. Zumindest sagen das Lehrbücher.
Außerdem finden Sie in diesem Artikel kommentiert . Sehr klare Erklärung zu deterministischem Trend vs. stochastischem Trend und wie man sie entfernt, um den Trend stationär zu machen, sowie eine sehr schöne Literaturübersicht zu diesem Thema. Sie verwenden es im neuronalen Netzwerkkontext, aber es ist nützlich für allgemeine Zeitreihenprobleme. Ihre endgültige Empfehlung ist, wenn es eindeutig als deterministischer Trend identifiziert wird, die lineare Tendenz zu tun, oder Differenzierung anzuwenden, um die Zeitreihen stationär zu machen. Die Jury ist immer noch da draußen, aber die meisten in diesem Artikel zitierten Forscher empfehlen eine Differenzierung im Gegensatz zu einer linearen Detrending.
Bearbeiten:
Unten ist ein Zufallslauf mit stochastischem Driftprozess unter Verwendung exogener Variablen und Differenzarima dargestellt. Beide scheinen die gleiche Antwort zu geben und sind im Wesentlichen gleich.
Hoffe das hilft!
quelle