Ich habe mit folgendem Code mit der Funktion stl (Seasonal Decomposition of Time Series by Loess) gezeichnet:
plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))
Es zeigt signifikante saisonale Schwankungen mit zufälligen Daten, die in den obigen Code eingegeben wurden (rnorm-Funktion). Jedes Mal, wenn dies ausgeführt wird, werden signifikante Abweichungen festgestellt, obwohl das Muster unterschiedlich ist. Zwei solche Muster sind unten gezeigt:
Wie können wir uns bei einigen Daten auf die STL-Funktion verlassen, wenn sie saisonale Schwankungen aufweist? Muss diese saisonale Variation im Hinblick auf einige andere Parameter gesehen werden? Vielen Dank für Ihren Einblick.
Der Code wurde von dieser Seite übernommen: Ist dies eine geeignete Methode, um saisonale Auswirkungen in Selbstmordzählungsdaten zu testen?
Antworten:
Die Lösszerlegung soll die Reihen glätten, indem Mittelwerte auf die Daten angewendet werden, so dass sie in Komponenten zerfallen, z. B. den Trend oder die Saison, die für die Analyse der Daten interessant sind. Diese Methode ist jedoch nicht dazu gedacht, einen formalen Test auf das Vorhandensein von Saisonalität durchzuführen .
Obwohl in Ihrem Beispiel
stl
ein geglättetes Muster der saisonalen Periodizität zurückgegeben wird, ist dieses Muster nicht relevant, um die Dynamik der Serie zu erklären. Um dies zu sehen, können wir die Varianz jeder Komponente in Bezug auf die Varianz der Originalserie vergleichen.Wir können sehen, dass es der Rest ist, der den größten Teil der Varianz in den Daten erklärt (wie wir es für einen Prozess mit weißem Rauschen erwarten würden).
Wenn wir eine Reihe mit Saisonalität nehmen, ist die relative Varianz der saisonalen Komponente viel relevanter (obwohl wir keine einfache Möglichkeit haben, sie zu testen, da Löss nicht parametrisch ist).
Die relativen Varianzen zeigen, dass die Saisonalität die Hauptkomponente ist, die die Dynamik der Serie erklärt.
Ein nachlässiger Blick auf die Handlung von
stl
kann trügerisch sein. Das nette Muster, das von zurückgegeben wirdstl
, lässt uns vielleicht denken, dass ein relevantes saisonales Muster in den Daten identifiziert werden kann, aber ein genauerer Blick kann zeigen, dass dies tatsächlich nicht der Fall ist. Wenn der Zweck darin besteht, über das Vorhandensein von Saisonalität zu entscheiden, kann die Lösszerlegung als vorläufige Ansicht nützlich sein, sie sollte jedoch durch andere Instrumente ergänzt werden.quelle
In ähnlicher Weise habe ich die Verwendung von Fourier-Modellen für nicht saisonale Daten gesehen, die eine saisonale Struktur in die Anpassungs- und Prognosewerte zwangen und ein ähnliches (keuchendes!) Ergebnis verursachten. Das Anpassen eines vermuteten Modells gibt dem Benutzer das, was er auferlegt / vermutet, was nicht immer das ist, was eine gute Analyse vorschlagen / liefern würde.
quelle
stl()
basiert nicht auf Fourier-Ideen. Obwohl ich noch niemanden gesehen habe, der eine "sinnlose" Analyse befürwortet, ist zu beachten, dass jede angepasste Modellfamilie als auferlegt oder vermutet angesehen werden kann. Die Frage ist, inwieweit ein Verfahren den Benutzern die Möglichkeit bietet, zu erkennen, ob und wie es für einen bestimmten Datensatz schlecht funktioniert.