Multivariate biologische Zeitreihen: VAR und Saisonalität

15

Ich habe einen multivariaten Zeitreihendatensatz, der interagierende biologische Variablen und Umgebungsvariablen (plus möglicherweise einige exogene Variablen) enthält. Neben der Saisonalität gibt es in den Daten keinen eindeutigen langfristigen Trend. Mein Ziel ist es zu sehen, welche Variablen miteinander in Beziehung stehen. Prognosen werden nicht wirklich gesucht.

Als Neuling in der Zeitreihenanalyse habe ich mehrere Referenzen gelesen. Soweit ich weiß, wäre das Vector Autoregressive (VAR) -Modell angemessen, aber ich fühle mich mit der Saisonalität nicht wohl und die meisten Beispiele, die ich fand, betrafen das Wirtschaftsfeld (so oft mit der Zeitreihenanalyse…) ohne Saisonalität.

Was soll ich mit meinen saisonalen Daten machen? Ich überlegte, sie zu deseasonalisieren - zum Beispiel würde ich in R decomposedie $trend + $randWerte verwenden und dann verwenden , um ein Signal zu erhalten, das ziemlich stationär erscheint (wie per beurteilt acf). Die Ergebnisse des VAR-Modells verwirren mich (ein 1-Lag-Modell wird ausgewählt, während ich intuitiv mehr erwartet hätte, und nur Koeffizienten für die Autoregression - und nicht für die Regression mit anderen verzögerten Variablen - sind signifikant). Mache ich etwas falsch oder sollte ich daraus schließen, dass meine Variablen nicht (linear) zusammenhängen / dass mein Modell nicht das richtige ist (Nebenfrage: Gibt es ein nicht lineares Äquivalent zu VAR?).

[Alternativ habe ich gelesen, dass ich wahrscheinlich saisonale Dummy-Variablen verwenden könnte, obwohl ich nicht genau weiß, wie ich sie implementieren soll].

Schritt-für-Schritt-Vorschläge wären mir sehr dankbar, da Details für erfahrene Benutzer für mich tatsächlich informativ sein könnten (und R-Code-Schnipsel oder Links zu konkreten Beispielen sind natürlich sehr willkommen).

ztl
quelle
2
Viel hängt davon ab, wie Sie über Saisonalität denken. Meine lückenhafte Lektüre der Literatur zeigt, dass Ökonomen Saisonalität oft als uninteressantes Ärgernis betrachten, während Umweltwissenschaftler dies oft viel positiver beurteilen. Die Methode der Dummy-Variablen, wie sie in der Ökonomie verwendet wird, hängt häufig davon ab, ob die Daten vierteljährlich oder monatlich vorliegen und ob die Auswirkungen von Feiertagen (im wahrsten Sinne des Wortes) manchmal unübersehbar sind. Mit Umweltdaten können Sie manchmal gut mit einigen Fourier-Begriffen (sinusförmigen Begriffen) umgehen und müssen nicht auf Dummies zurückgreifen.
Nick Cox
2
Vielen Dank, @ Nick Cox. Fourier-Terme scheinen in meinem speziellen Fall keine Lösung zu sein, bei der Variablen ein komplizierteres saisonales Muster aufweisen als sinusförmige Signale (es sei denn, ich verwende mehrere Harmonische, aber dies ist hier nicht so sehr der Zweck). Und obwohl Saisonalität in meinem Fall eindeutig kein uninteressanter Störbegriff ist, suchte ich mehr nach einer Möglichkeit, die zusätzliche Variabilität der Daten über die Saisonalität hinaus (dh den längerfristigen Trend) als Funktion anderer Variablen zu erklären.
15.
4
Was ist mit einem multivariaten ARMA-Modell? Es ähnelt VAR, aber wenn ich es richtig verstehe, erlaubt es eine dynamischere Interaktion zwischen Variablen. Möglicherweise kann jemand anderes meinen Verdacht bestätigen / zurückweisen.
rbatt

Antworten:

1

Ich weiß, dass diese Frage ziemlich alt ist, aber sie blieb unbeantwortet. Die Hauptfrage ist vielleicht nicht, wie der saisonale Zyklus in den Daten entfernt werden soll, aber er ist Teil davon. Ich werde es versuchen: Um die Saisonalität aus einem Datensatz zu entfernen, gibt es verschiedene Methoden, von einfachen monatlich aggregierten Durchschnitten bis zu Anpassen einer sinusförmigen (oder einer anderen geeigneten harmonischen) Funktion mit nichtlinearen Anpassungsmethoden wie Nelder-Mead.

Am einfachsten ist es, die Daten aller Januar, Februar usw. zu mitteln, dh Sie erstellen einen zusammengesetzten Jahreszyklus, den Sie dann von Ihren Daten subtrahieren können

Nukimov
quelle