Unter welchen Umständen ist ein MA-Prozess oder ein AR-Prozess angemessen?

21

Ich verstehe, dass, wenn ein Prozess von vorherigen Werten von sich selbst abhängt, es ein AR-Prozess ist. Wenn es von vorherigen Fehlern abhängt, dann ist es ein MA-Prozess.

Wann würde eine dieser beiden Situationen eintreten? Hat jemand ein solides Beispiel, das die zugrunde liegende Frage beleuchtet, was es bedeutet, dass ein Prozess am besten als MA gegen AR modelliert wird?

Matt O'Brien
quelle
3
Es ist keine so einfache Zweiteilung. Schließlich kann ein AR als ein unendliches MA und ein (invertierbares) MA als ein unendliches AR geschrieben werden.
Glen_b -Reinstate Monica
1
Glen_b, können Sie das näher erläutern? Ich verstehe, dass es keine einfache Zweiteilung ist ... kann ich zu Recht davon ausgehen (hoffe sogar), dass es hier etwas gibt, das es wert ist, aufgedeckt zu werden? Ich möchte nicht einfach acf / pacf ausführen und so tun, als hätte ich einen guten Überblick über diesen Prozess.
Matt O'Brien
Sehr ähnlich: Beispiele aus der
Praxis

Antworten:

10

Ein wichtiges und nützliches Ergebnis ist das Wold-Repräsentations-Theorem (manchmal Wold-Dekomposition genannt), das besagt, dass jede kovarianzstationäre Zeitreihe Y.t als die Summe von zwei Zeitreihen, einer deterministischen und einer stochastischen, geschrieben werden kann.

Y.t=μt+j=0bjεt-jwobei μt deterministisch ist.

Der zweite Term ist ein unendlicher MA.

(Es ist auch der Fall, dass ein invertierbarer MA als ein unendlicher AR-Prozess geschrieben werden kann.)

Dies legt nahe, dass Sie den stochastischen Teil immer als MA-Prozess schreiben können , wenn die Reihe kovarianzstabil ist und Sie den deterministischen Teil identifizieren können. Wenn der MA die Invertierbarkeitsbedingung erfüllt, können Sie ihn auch immer als AR-Prozess schreiben.

Wenn Sie den Prozess in einem Formular geschrieben haben, können Sie ihn häufig in das andere Formular konvertieren.

Zumindest in gewisser Hinsicht ist für stationäre Kovarianzreihen häufig entweder AR oder MA angemessen.

In der Praxis hätten wir natürlich lieber keine sehr großen Modelle. Wenn Sie einen endlichen AR oder MA haben, verschwinden sowohl der ACF als auch der PACF schließlich geometrisch (es gibt eine geometrische Funktion, unter der der Absolutwert einer der beiden Funktionen liegt), was tendenziell bedeutet, dass eine gute Annäherung an einen AR oder einen PACF vorliegt MA in der anderen Form kann oft recht kurz sein.

Unter der stationären Kovarianzbedingung und der Annahme, dass wir die deterministischen und stochastischen Komponenten identifizieren können, sind häufig sowohl AR als auch MA geeignet.

Die Methode von Box und Jenkins sucht nach einem sparsamen Modell - einem AR-, MA- oder ARMA-Modell mit wenigen Parametern. Typischerweise werden ACF und PACF verwendet, um zu versuchen, ein Modell zu identifizieren, indem in Stationarität übergegangen wird (möglicherweise durch Differenzierung), ein Modell anhand des Erscheinungsbilds von ACF und PACF identifiziert wird (manchmal verwenden die Benutzer andere Tools), das Modell angepasst und anschließend das Modell untersucht wird Struktur der Residuen (typischerweise über die ACF und PACF der Residuen), bis die Residuenserie mit weißem Rauschen einigermaßen konsistent erscheint. Oft gibt es mehrere Modelle, die eine sinnvolle Annäherung an eine Serie darstellen. (In der Praxis werden oft andere Kriterien berücksichtigt.)

Es gibt einige Gründe, diesen Ansatz zu kritisieren. Zum Beispiel berücksichtigen die p-Werte, die sich aus einem solchen iterativen Prozess ergeben, im Allgemeinen nicht, wie das Modell gefunden wurde (durch Betrachten der Daten). Dieses Problem könnte zum Beispiel durch Stichprobenaufteilung zumindest teilweise vermieden werden. Ein zweites Beispiel Kritik ist die Schwierigkeit, eine stationäre Serie tatsächlich zu erhalten - während man in vielen Fällen zu einer Serie transformieren kann, die mit der Stationarität einigermaßen vereinbar zu sein scheint, wird es normalerweise nicht der Fall sein, dass dies tatsächlich der Fall ist (ähnliche Probleme treten häufig auf) Problem mit statistischen Modellen, obwohl es hier manchmal mehr ein Problem sein kann).

[Die Beziehung zwischen einem AR und dem entsprechenden unendlichen MA in Hyndman und Athanasopoulos' diskutiert Forecasting: Prinzipien und Praxis , hier ]

Glen_b - Setzen Sie Monica wieder ein
quelle
1
-1 weil, obwohl es irgendwie interessant ist, es den Geist der Frage nicht wirklich beantwortet.
Jake Westfall
Hallo Jake, danke, dass du den Kommentar dazu hinzugefügt hast, was deiner Meinung nach mit der Antwort falsch ist. Dies ist weitaus hilfreicher als eine Ablehnung alleine. Ich bin damit einverstanden, dass hier etwas fehlt - zumindest sollte klargestellt werden, warum ich dachte, dass dies relevant genug ist, um als Antwort zu posten.
Glen_b
1
@jake Ich habe einige Änderungen vorgenommen, die hoffentlich den Zusammenhang zur Frage verdeutlichen.
Nochmals vielen
Danke für die Änderungen. Ich habe meine Ablehnung entfernt. Meine Ein-Satz-Zusammenfassung Ihrer überarbeiteten Antwort würde ungefähr so ​​lauten: "Diese Frage ist im Allgemeinen schwierig zu beantworten, da in vielen Fällen entweder ein AR- oder ein MA-Modell genau so gut zu den Daten passen könnte wie das andere. " Was eine legitime, wenn auch enttäuschende Antwort auf die Frage ist.
Jake Westfall
@Jake hat nicht das Bedürfnis, die Ablehnung zu entfernen, wenn Sie noch Reservierungen haben. Ich freue mich über die Chance, die Antwort in beiden Richtungen zu verbessern.
Glen_b -Reinstate Monica
5

Ich kann eine meiner Meinung nach überzeugende Antwort auf den ersten Teil der Frage geben ("woher MA?"), Überlege mir aber gerade eine ebenso überzeugende Antwort auf den zweiten Teil der Frage ("woher AR?").

Betrachten Sie eine Serie, die aus dem Schlusskurs (bereinigt um Splits und Dividenden) einer Aktie an aufeinander folgenden Tagen besteht. Der Schlusskurs eines jeden Tages wird aus einem Trend (z. B. linear in der Zeit) und den gewichteten Auswirkungen der täglichen Schocks der vorherigen Tage abgeleitet. Vermutlich wird die Auswirkung des Schocks am Tag t-1 den Kurs am Tag t stärker beeinflussen als der Schock am Tag t-2 usw. Folglich wird der Schlusskurs der Aktie am Tag t logischerweise den Trend widerspiegeln Wert am Tag t plus eine Konstante (kleiner als 1) multipliziert mit der gewichteten Summe der Schocks bis zum Tag t-1 (dh dem Fehlerterm am Tag t-1) (MA1), möglicherweise plus eine Konstante (kleiner als 1) mal die gewichtete Summe der Schocks bis zum Tag t-2 (dh der Fehlerterm am Tag t-2) (MA2), ..., plus den neuen Schock am Tag t (weißes Rauschen). Diese Art von Modell scheint für Modellserien wie die Börse geeignet zu sein, bei denen der Fehlerausdruck am Tag t die gewichtete Summe aus früheren und aktuellen Schocks darstellt und einen MA-Prozess definiert. Ich arbeite an einer ebenso überzeugenden Begründung für einen exklusiven AR-Prozess.

Schüler
quelle
3
+1. Dies ist die bisher einzige Antwort, die sogar versucht, die ursprüngliche Frage zu beantworten.
S. Kolassa - Wiedereinsetzung von Monica
Wenn ich es richtig verstehe, klingt es so, als ob der AR-Prozess besser für die Korrektur wiederkehrender Trends geeignet ist, aber MA ist besser für die Korrektur großer, nicht wiederkehrender Schocks.
Mike Campbell
0

Dies ist das einfachste Beispiel für die Visualisierung von AR-, MA- und ARMA-Prozessen.

Beachten Sie, dass dies nur eine visuelle Hilfe für eine Einführung in das Thema ist und keineswegs streng genug, um alle möglichen Fälle zu berücksichtigen.

Angenommen, es gibt zwei Agenten in einem Wettbewerb, die mit der Ausführung einer bestimmten Aktion beauftragt sind (horizontal nach rechts springen).

  1. Es wird erwartet, dass der „Mensch“ bei jedem Sprung eine Distanz von „μ“ mit einer Standardabweichung von „𝛿“ gemäß seiner / ihrer körperlichen Leistungsfähigkeit zurücklegt. Dem Menschen mangelt es jedoch besonders an geistiger Stärke :) und seine Leistung hängt auch davon ab, ob der vorherige Sprung seine Erwartungen verfehlt / erfüllt / übertroffen hat.

  2. Die „Maschine“ wurde genau nach den gleichen Spezifikationen wie der oben genannte Mensch konstruiert, mit nur einem Unterschied: Die Maschine ist emotionslos und wird von früheren Leistungen nicht beeinträchtigt.

Es gibt auch zwei Spiele, die von beiden Agenten mit jeweils zwei Sprüngen gespielt werden müssen:

  1. "Final Jump" wird auf der Grundlage der im Final Jump zurückgelegten Distanz nach einem Warmup-Jump gewertet, dessen Ergebnis im Wettbewerb ignoriert wird, aber dem Menschen zur Beobachtung zur Verfügung steht. Der letzte Sprung beginnt dort, wo der Aufwärmsprung beginnt.

  2. Der „kombinierte Sprung“ wurde auf der Grundlage der kombinierten Distanz der Anfangs- und Endsprünge gewertet. Der letzte Sprung beginnt dort, wo der Anfangssprung landet.

Die folgende Tabelle zeigt, welches Modell die vier Szenarien für die oben genannten Akteure und Spiele am besten beschreibt.

Diagramm zur Beschreibung der Unterschiede zwischen AR-, MA- und ARMA-Prozessen

CodeWarrior
quelle
Dieses Poster braucht eine Erklärung und einen Kontext, um verständlich zu sein. Könnten Sie das in Ihrer Antwort angeben?
Whuber
-1

Sie haben also eine univariate Zeitreihe und möchten diese modellieren / prognostizieren, oder? Sie haben sich für die Verwendung eines ARIMA-Modells entschieden.

Die Parameter von hängen davon ab, was für Ihren Datensatz am besten geeignet ist. Aber wie findest du es heraus? Ein neuerer Ansatz ist "Automatic Time Series Forecasting" von Hyndman & Khandakar (2008) ( pdf ).

Der Algorithmus versucht verschiedene Versionen von p, q, P und Q und wählt die mit dem kleinsten AIC, AICc oder BIC. Es ist in der auto.arima () -Funktion des Forecast-R-Pakets implementiert . Die Auswahl des Informationskriteriums hängt davon ab, welche Parameter Sie an die Funktion übergeben.

Bei einem linearen Modell kann die Auswahl eines Modells mit dem kleinsten AIC einer einmaligen Kreuzvalidierung gleichkommen.

Sie sollten auch sicherstellen, dass Sie über genügend Daten verfügen, mindestens vier Jahre.

Einige wichtige Überprüfungen:

  1. Ist das Modell sinnvoll? Wenn Sie beispielsweise monatliche Einzelhandelsumsätze haben, werden Sie wahrscheinlich erwarten, dass ein saisonales Modell fit ist.
  2. Wie gut prognostiziert es aus der Stichprobe?

Explizite Antwort auf den Kommentar von Firebug unten: Wenn Ihre Daten dies unterstützen.

Leistung
quelle
3
Diese Antwort beantwortet die Frage überhaupt nicht:"My question is, when would one of either of these two situations occur? "
Firebug
1
"Explizite Antwort auf Firebugs Kommentar unten: Wenn Ihre Daten dies unterstützen." Ich stimme @Firebug zu - dies ist keine Antwort auf die Frage und definitiv kein gutes Beispiel für die Unterscheidung zwischen den beiden ...
Thomas
xkcd.com/386
power