Wahl zwischen additivem und multiplikativem Modell?

7

Ich habe eine Reihe von Daten, die ich gerade analysiere.

Ich habe Schwierigkeiten zu entscheiden, ob ein additives Modell zur Vorhersage der Daten verwendet werden soll oder ob ich ein multiplikatives Modell verwenden soll .

Ich kenne den Unterschied zwischen den beiden und kann das richtige Modell anwenden, wenn die Rohdaten linear sind ... aber in diesem Fall sind meine Daten nicht linear.

Ich habe eine Zeitreihe meiner Daten angehängt - welches der beiden Modelle soll ich verwenden und warum?

(Mein Instinkt ist, mit dem additiven Modell zu gehen, auf der Grundlage, dass das Ausmaß der saisonalen Schwankungen (oder die Variation um den Trendzyklus) nicht mit dem Niveau der Zeitreihen zu variieren scheint.

Geben Sie hier die Bildbeschreibung ein

Jonas Blaps
quelle

Antworten:

3

Ich würde auch für Additiv gehen. Da Ihr scheinbares Signal niederfrequent zu sein scheint, können Sie zumindest empirisch ein wenig darüber hinausgehen. Sie können beispielsweise die Homoskedastizität endlicher Differenzen der Daten (erster oder zweiter Ordnung) überprüfen. Dies würde als sehr grobes Hochpassfilter wirken, bei dem man erwarten könnte, dass das Rauschen dominiert.

Wenn Ihr Signal viel länger ist, können bewegliche Fenster und Fourier-Transformationen hilfreich sein.

Bei der Prognose können Sie jedoch beide Modelle parallel ausführen und anhand der Statistiken der Vergangenheit entscheiden, welches Modell Sie anwenden, z. B. basierend auf der besten Leistung eines dieser Modelle. Dies ist eine heuristische Methode, die ich kürzlich bei der Vorhersage von Ergebnissen für die Co-Simulation von Hybridsystemen verwendet habe, bei der kein Modell bekannt ist: Führen Sie verschiedene Extrapolationen parallel, sehr schnell durch und entscheiden Sie. Es ist nicht sehr theoretisch, aber es funktioniert gut mit unseren Daten.

Bei Interesse könnte ich mich entwickeln. Die Referenz heißt: CHOPtrey: Kontextuelle Online-Polynomextrapolation für eine verbesserte Mehrkern-Co-Simulation komplexer Systeme

Da die Daten recht kurz sind und ich nicht sicher bin, ob wir eine vollständige Saisonperiode haben, habe ich versucht, eine Fourier-Analyse der Daten, ihres Gradienten und des Laplace-Werts durchzuführen. Die Fluktuation scheint ziemlich periodisch zu sein, daher habe ich im unteren Diagramm versucht, einen gleitenden "Filter" -Durchschnitt zu entwerfen. Die Amplitude des Rückstands variiert nicht stark. Es scheint wirklich nicht zufällig zu sein.

Fourier-Typprüfungen

Laurent Duval
quelle
1
Ich danke Ihnen sehr für Ihre Antwort! Sehr hilfreich und informativ! Ich werde einige Holdback-Daten für die Prognose verwenden. Was wäre Ihrer Meinung nach der beste und einfachste statistische Test, den ich für die Daten außerhalb der Stichprobe (Holdback) verwenden kann, um die Genauigkeit der Prognosen zu testen?
Jonas Blaps
@ JonasBlaps Haben Sie die Möglichkeit, die Daten zu teilen?
Laurent Duval
Die Verwendung von Holdback-Daten von einem Ursprung kann fehlerhaft sein, wenn die Holdout-Daten Anomalien aufweisen. Die optimale Vorhersage fehlerhafter Daten kann zu einer schlechten Modellauswahl führen. Dies wird oft als "der Schwanz
wedelt mit dem Hundesyndrom
@IrishStat In der Tat wollte ich ein exponentiell gewichtetes Kriterium (im Geiste der EWMA) vorschlagen, das es ermöglicht, die Vergangenheit der Vergangenheit schrittweise zu vergessen
Laurent Duval
1
Anstatt irgendeine Form eines gewichteten Durchschnitts anzunehmen, ist es weitaus besser, die optimale Form über ARIMA zu bestimmen und dabei jede fragwürdige deterministische Struktur wie Pegelverschiebungen / Trends / saisonale Impulse und natürlich Impulse zu berücksichtigen.
IrishStat
2

Ich nahm die 55 Werte und verwendete AUTOBOX, um automatisch ein Hybridmodell zu erkennen, das möglicherweise sowohl eine deterministische Struktur als auch eine ARIMA-Struktur enthält. Das Geben Sie hier die Bildbeschreibung einDiagramm der Originaldaten und das ACF-Diagramm der Geben Sie hier die Bildbeschreibung einOriginalserie finden Sie hier. AUTOBOX kam zu dem Schluss, dass ein einzelner Trend und drei saisonale Dummies besser geeignet sind als SARIMA und gleichzeitig die AR-Struktur der Ordnung 1 enthalten. Hier ist das Modell Geben Sie hier die Bildbeschreibung ein UND hier Geben Sie hier die Bildbeschreibung einmit den folgenden statistischen Zusammenfassungen Geben Sie hier die Bildbeschreibung ein.

Das Residuendiagramm deutet hier auf eine ausreichende Übereinstimmung Geben Sie hier die Bildbeschreibung einmit dem begleitenden ACF der Residuen hin Geben Sie hier die Bildbeschreibung ein.

Das Diagramm für Geben Sie hier die Bildbeschreibung einIst, Anpassung und Prognose ist hier und das von OUTLIER angepasste Diagramm zeigt deutlich, dass die 4 Impulse im Modell erforderlich sind Geben Sie hier die Bildbeschreibung ein. Schließlich ist das Fo- Geben Sie hier die Bildbeschreibung einRecast-Diagramm für die nächsten 8 Perioden hier.

Transformationen wie Logarithmen oder multiplikative Modelle müssen durch die Daten oder durch den Benutzer mit bestimmten Domänenkenntnissen begründet und vorgeschlagen werden. Dies war in diesem Fall nicht so. Hier erfahren Sie, wann Leistungstransformationen erforderlich sind. Wann (und warum) sollten Sie das Protokoll einer Verteilung (von Zahlen) erstellen? . Beachten Sie, dass AUTOBOX im Wesentlichen auf dem HW Additive Seasonal Model mit TREND und 4 Anomalien und einem hoch signifikanten AR (1) -Koeffizienten konvergierte.

KOMMENTARE FÜR LAURENT:

Drei der vier deterministischen Kommentare waren erforderlich (Trend, Seasonal (QUARTERLY) Dummies and Pulses), während die AR (1) -Struktur für das Kurzzeitgedächtnis benötigt wurde.

IrishStat
quelle
Dankbar für die Details
Laurent Duval