Wie mache ich eine Zeitreihe stationär?

42

Was sind andere Techniken zum Erstellen einer instationären, stationären Zeitreihe neben dem Aufnehmen von Differenzen?

Gewöhnlich bezeichnet man eine Reihe als " integriert von der Ordnung p ", wenn sie durch einen Verzögerungsoperator ortsfest gemacht werden kann .(1L)PXt

Shane
quelle

Antworten:

18

De-Trending ist von grundlegender Bedeutung. Dies beinhaltet die Regression gegen andere Kovariaten als die Zeit.

Die saisonale Anpassung ist eine Version der Differenzenerfassung, kann jedoch als separate Technik ausgelegt werden.

Die Transformation der Daten konvertiert implizit einen Differenzoperator in etwas anderes. ZB sind Unterschiede der Logarithmen tatsächlich Verhältnisse.

Einige EDA-Glättungstechniken (z. B. das Entfernen eines sich bewegenden Medians) können als nicht parametrische Methoden zum Abwerten ausgelegt werden. Sie wurden als solche von Tukey in seinem Buch über EDA verwendet. Tukey fuhr fort, indem er die Residuen entfernte und diesen Prozess so lange wiederholte, bis er Residuen erreichte, die stationär und symmetrisch um Null verteilt erschienen.

whuber
quelle
Können Sie näher erläutern, wie das Trending durchgeführt wird? Wie kann der Einfluss von Kovariaten durch Regression beseitigt werden? Wenn ich richtig liege, gilt dies nur für multivariate Zeitreihen.
Arpit Sisodia
1
@Arpit Sie ersetzen die Originaldaten durch ihre Residuen in den Regressionen gegen die Kovariaten. Es gilt sowohl für univariate Zeitreihen als auch für multivariate Zeitreihen. Dies wird unter stats.stackexchange.com/a/113207/919 und stats.stackexchange.com/a/46508/919 näher erläutert und veranschaulicht .
Whuber
@whuber Glaubst du nicht, dass der Rückschritt gegen Kovariaten (der instationär sein kann) uns dem Problem der unechten Regression aussetzen kann?
Vishaal Sudarsan
10

Ich denke immer noch, dass die Verwendung der prozentualen Änderung von einer Periode zur nächsten der beste Weg ist, eine instationäre Variable stationär zu machen, wie Sie zuerst vorschlagen. Eine Transformation wie ein Protokoll funktioniert recht gut (sie verringert die instationäre Qualität, beseitigt sie jedoch nicht vollständig).

Die dritte Möglichkeit besteht darin, die Daten gleichzeitig in einer einzigen linearen Regression zu deseasonalisieren und zu de-trendieren. Eine unabhängige Variable wäre Trend (oder Zeit): 1, 2, 3, ... bis zu wie viel Zeit Sie haben. Die andere Variable wäre eine kategoriale Variable mit 11 verschiedenen Kategorien (für 11 der 12 Monate). Mit dem resultierenden Koeffizienten aus dieser Regression können Sie dann die Daten gleichzeitig herunterskalieren und de-saisonalisieren. Sie werden sehen, dass Ihr gesamter Datensatz im Wesentlichen abgeflacht ist. Die verbleibenden Unterschiede zwischen den Perioden werden Veränderungen widerspiegeln, die sowohl vom Wachstumstrend als auch von der Jahreszeit unabhängig sind.

Sympa
quelle
Können Sie den Koeffizienten etwas ausführlicher für Anfänger erklären? Ich bin der Meinung, dass Ihr Ansatz einen Versuch wert ist, da sich der Trend abflacht, wenn ich Unterschiede in meinem Fall festhalte (Wachstumsraten), aber die Saisonalität stark wird. Daher scheint es sich zu lohnen, den simulatenen Ansatz auszuprobieren. Aber was mache ich mit den beiden Koeffizienten? insbesondere meine ich die dummies ...
hans0l0
ran2, ich weiß, dass es vielleicht nicht so klar ist, aber ich kann es nicht viel besser erklären als ich es bereits getan habe. Es ist mehr als alles andere ein Spiegelbild meiner eigenen Kommunikationsfähigkeiten. Stattdessen würde ich die grundlegende Korrektur vorschlagen, die häufiger als nicht funktioniert. Das heißt, Sie ändern einfach Ihre nominale Zeitreihenvariable in eine prozentuale Änderung von einer Periode zur nächsten und so weiter. Wenn Sie sich auf die prozentuale Änderung anstelle von Nennwerten konzentrieren, wird eine nicht stationäre Variable sofort in eine stationäre Variable umgewandelt, die Sie dann leicht zurückführen können.
Sympa
7

Protokolle und Wechselwirkungen sowie andere Energieumwandlungen führen häufig zu unerwarteten Ergebnissen.

In einigen Fällen kann dies für schädliche Residuen (z. B. Tukey) von Bedeutung sein, kann jedoch gefährlich sein. Andererseits können Forscher mithilfe von Interventionserkennungsmethoden systematisch Pegelverschiebungen und Trendänderungen erkennen. Da eine Pegelverschiebung die Differenz eines Zeittrends ist, so wie ein Impuls die Differenz einer Pegelverschiebung ist, werden die von Ruey Tsay angewandten Methoden von diesem Problem leicht abgedeckt.

Wenn eine Serie Pegelverschiebungen aufweist (dh Änderungen im Achsenabschnitt), besteht das geeignete Mittel, um die Serie stationär zu machen, darin, die Serie zu "erniedrigen". Box-Jenkins hat einen kritischen Fehler begangen, indem er angenommen hat, dass das Mittel gegen die Nichtstationarität ein differenzierender Operator ist. Manchmal ist also eine Differenzierung angebracht, und manchmal ist eine Anpassung an die mittlere Verschiebung "s" angebracht. In jedem Fall kann die Autokorrelationsfunktion eine Nichtstationarität aufweisen. Dies ist ein Symptom für den Zustand der Serie (dh stationär oder instationär). Bei erkennbarer Nichtstationarität können die Ursachen unterschiedlich sein. Zum Beispiel hat die Serie einen sich ständig ändernden Mittelwert oder die Serie hat eine vorübergehende Änderung des Mittelwerts.

Der vorgeschlagene Ansatz wurde erstmals 1982 von Tsay vorgeschlagen und zu einer gewissen Software hinzugefügt. Die Forscher sollten sich auf Tsays Artikel im Journal of Forecasting mit dem Titel "Ausreißer, Pegelverschiebungen und Änderungen der Varianz in Zeitreihen" im Journal of Forecasting, Band 3, beziehen. 7, I-20 (1988).

Wie üblich enthalten Lehrbücher nur langsam Spitzentechnologien, aber auf dieses Material kann im Wei-Buch (dh Zeitreihenanalyse) verwiesen werden. Delurgio und Makradakis behandeln die Eingriffe, aber nicht, wie sie im Text von Wei zu erkennen sind.

Tom Reilly
quelle
4

Unterschied zu einer anderen Serie. Das heißt, die Brent-Ölpreise sind nicht stationär, aber der Spread für leichtes süßes Rohöl ist. Eine riskantere Prognosemöglichkeit besteht darin, auf das Bestehen einer Ko-Integrationsbeziehung mit einer anderen Zeitreihe zu setzen.

user603
quelle
4

Könnten Sie einen Löss / Spline durch die Daten ziehen und die Residuen verwenden? Wären die Reste stationär?

Es scheint mit zu berücksichtigenden Problemen behaftet zu sein, und möglicherweise gibt es keinen so deutlichen Hinweis auf eine zu flexible Kurve wie auf eine zu starke Differenzierung.

Wayne
quelle
+1 für die Angabe der Lösung, die offensichtlich und doch stark unterdiskutiert ist. Jede Methode ist mit Problemen behaftet, aber die nichtparametrische Glättung ist von grundlegender Bedeutung, und es muss eingehend untersucht werden, inwiefern sich alle anderen vorgeschlagenen Methoden zur Abwehr von Fehlern auf diese beziehen. Würde mich freuen, von relevanten Quellen zu hören ...
zkurtz