Wann muss eine Zeitreihe protokolliert werden, bevor ein ARIMA-Modell angepasst wird?

26

Ich habe vorher Forecast Pro verwendet, um univariate Zeitreihen zu prognostizieren, schalte aber meinen Workflow auf R um. Das Prognosepaket für R enthält viele nützliche Funktionen, aber eines tut es nicht, bevor es automatisch ausgeführt wird .arima (). In einigen Fällen beschließt Forecast Pro, Transformationsdaten zu protokollieren, bevor Prognosen erstellt werden, aber ich habe noch nicht herausgefunden, warum.

Meine Frage lautet also: Wann sollte ich meine Zeitreihen log-transformieren, bevor ich ARIMA-Methoden versuche?

/ edit: Nachdem ich Ihre Antworten gelesen habe, werde ich so etwas verwenden, wobei x meine Zeitreihe ist:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

Macht das Sinn?

Zach
quelle

Antworten:

21

Einige Vorsichtsmaßnahmen, bevor Sie fortfahren. Wie ich meinen Schülern oft vorschlage, verwenden Sie die auto.arima()Dinge nur als erste Annäherung an Ihr Endergebnis oder wenn Sie ein sparsames Modell haben möchten, wenn Sie überprüfen, ob Ihr auf der Konkurrenz basierendes Modell besser abschneidet.

Daten

Sie müssen klar von der Beschreibung der Zeitreihendaten ausgehen, mit denen Sie arbeiten. In der Makroökonometrie arbeiten Sie normalerweise mit aggregierten Daten, und geometrische Mittel haben (überraschenderweise) empirischere Belege für Makrozeitreihendaten, wahrscheinlich, weil die meisten von ihnen in exponentiell wachsende Trends zerlegt werden können .

Übrigens funktioniert Robs Vorschlag "visuell" für Zeitreihen mit klarem saisonalen Anteil , da sich langsam ändernde jährliche Daten für die Zunahme der Variation weniger klar sind. Glücklicherweise ist in der Regel ein exponentiell wachsender Trend zu beobachten (wenn er linear zu sein scheint, sind keine Protokolle erforderlich).

Modell

Wenn Ihre Analyse auf einer Theorie basiert, die besagt, dass ein gewichtetes geometrisches Mittel Y.(t)=X1α1(t)...Xkαk(t)ε(t)

In der Finanzökonometrie sind Protokolle aufgrund der Beliebtheit von ...

Protokolltransformationen haben nette Eigenschaften

Im log-log-Regressionsmodell ist dies die Interpretation des geschätzten Parameters als Elastizität von Y ( t ) auf X iαichY.(t)Xich(t)

In Fehlerkorrekturmodellen wird empirisch stärker davon ausgegangen, dass die Proportionen stabiler ( stationärer ) sind als die absoluten Differenzen.

In der Finanzökonometrie ist es einfach, die logarithmischen Renditen über die Zeit zu aggregieren .

Es gibt viele andere Gründe, die hier nicht erwähnt werden.

Endlich

Beachten Sie, dass die Protokolltransformation normalerweise auf nicht negative (Ebenen-) Variablen angewendet wird. Wenn Sie die Unterschiede zweier Zeitreihen beobachten (z. B. Nettoexport), ist es nicht einmal möglich, das Protokoll zu erstellen. Sie müssen entweder nach Originaldaten in Ebenen suchen oder die Form eines gemeinsamen Trends annehmen, der subtrahiert wurde.

[ Ergänzung nach der Bearbeitung ] Wenn Sie weiterhin ein statistisches Kriterium für die Durchführung der Protokolltransformation wünschen , ist eine einfache Lösung ein Test für die Heteroskedastizität. Bei zunehmender Varianz würde ich Goldfeld-Quandt-Test oder ähnliches empfehlen . In R befindet es sich in library(lmtest)und wird durch gqtest(y~1)Funktion bezeichnet. Wenn Sie kein Regressionsmodell haben, yist dies Ihre abhängige Variable.

Dmitrij Celov
quelle
Danke für die Information. Je niedriger der p-Wert beim GQ-Test ist, desto wahrscheinlicher ist die Verteilung heteroskedastisch?
Zach
@Zach: Genau genommen zum Beispiel 5%, wenn Sie nicht vorhaben, auf Data Mining umzusteigen. Ich persönlich gehe von den Modellannahmen aus.
Dmitrij Celov
@Dmitrij. Vielen Dank. Ich möchte nur sicherstellen, dass ich die Ausgabe richtig interpretiere.
Zach
29

Zeichnen Sie ein Diagramm der Daten gegen die Zeit. Wenn es so aussieht, als würde die Abweichung mit dem Level der Serie zunehmen, führen Sie Protokolle durch. Andernfalls modellieren Sie die Originaldaten.

Rob Hyndman
quelle
3
Hier ist eine Frage: Was bewirkt es, wenn Sie Protokolle aufnehmen und diese nicht benötigt werden? Mir hat es gefallen, wenn ich mit Zeitreihen arbeite, für die eine Log-Transformation erforderlich ist, da die Koeffizienten (wie ich es verstehe) Verhältnisse und bei kleinen Werten beinahe Prozentsätze sind. (ZB exp (0,05) = 1,051.)
Wayne
4

An ihren Früchten sollt ihr sie erkennen

Die (zu testende) Annahme ist, dass die Fehler aus dem Modell eine konstante Varianz haben. Beachten Sie, dass dies nicht die Fehler eines angenommenen Modells bedeutet. Wenn Sie eine einfache grafische Analyse verwenden, gehen Sie im Wesentlichen von einem linearen Zeitmodell aus.

Wenn Sie also ein unangemessenes Modell haben, wie es durch eine zufällige Darstellung der Daten gegen die Zeit nahegelegt wird, können Sie fälschlicherweise auf die Notwendigkeit einer Leistungstransformation schließen. Box und Jenkins taten dies mit ihrem Airline Data-Beispiel. Sie berücksichtigten nicht 3 ungewöhnliche Werte in den neuesten Daten und folgerten fälschlicherweise, dass es eine größere Variation der Residuen auf der höchsten Ebene der Serie gab.

Weitere Informationen zu diesem Thema finden Sie unter http://www.autobox.com/pdfs/vegas_ibf_09a.pdf

IrishStat
quelle
1

Möglicherweise möchten Sie Serien protokollieren und transformieren, wenn sie auf natürliche Weise geometrisch sind oder wenn der Zeitwert einer Investition impliziert, dass Sie sich mit einer Anleihe mit minimalem Risiko vergleichen, die eine positive Rendite erzielt. Dadurch werden sie "linearisierbarer" und eignen sich daher für eine einfache differenzierende Wiederholungsbeziehung.

DWin
quelle
1
Transformationen sind wie Drogen: Einige sind gut für dich und andere nicht. Wenn Sie nicht daran interessiert sind, statistische Hypothesen zu testen, können Sie alles annehmen, was Sie wollen. Parametertests der Hypothese haben Annahmen über den Fehlerpreis, ignorieren Sie diese auf Ihre Gefahr.
IrishStat
1
So wahr. Ich habe gesagt, dass der Prozess geometrisch sein muss. Wird die Transformation nicht durchgeführt, kann dies ebenfalls zu Inferenzfehlern führen. Ich sehe nicht, wo ich vorschlug, die Annahmen bezüglich der Bedingungen der gültigen Schlussfolgerung zu ignorieren.
DWin
1
stats.stackexchange.com/questions/6498/… enthielt eine Diskussion darüber, wann und warum eine Transformation durchgeführt werden sollte. Die "Tatsache", dass die ursprünglichen Deries "geometrisch" sind, lässt nicht darauf schließen, dass die Residuen eines geeigneten Modells eine Standardabweichung aufweisen, die proportional zum Mittelwert ist. Es könnte ABER es muss empirisch nachgewiesen oder zumindest getestet werden.
IrishStat