Schätzen Sie die ARMA-Koeffizienten durch ACF- und PACF-Inspektion

16

Wie schätzen Sie das geeignete Prognosemodell für eine Zeitreihe durch visuelle Überprüfung der ACF- und PACF-Diagramme? Welches (dh ACF oder PACF) teilt dem AR oder dem MA mit (oder beides)? Welcher Teil der Grafiken zeigt Ihnen den saisonalen und den nicht saisonalen Teil für eine saisonale ARIMA?

Betrachten Sie die unten angezeigten ACF- und PCF-Funktionen. Sie stammen aus einer logarithmisch transformierten Serie, die zweimal differenziert wurde, einem einfachen Unterschied und einem saisonalen ( Originaldaten , logarithmisch transformierte Daten ). Wie würden Sie die Serie charakterisieren? Welches Modell passt am besten dazu?

Bildbeschreibung hier eingeben

4everlearning
quelle

Antworten:

12

Meine Antwort ist wirklich eine Abkürzung von javlacelle, aber sie ist zu lang für einen einfachen Kommentar, aber nicht zu kurz, um nutzlos zu sein.

Während die Reaktion von jvlacelle auf einer Ebene technisch korrekt ist, "vereinfacht" sie sich zu sehr, da sie bestimmte "Dinge" voraussetzt, die normalerweise niemals wahr sind. Es wird davon ausgegangen, dass keine deterministische Struktur wie ein oder mehrere Zeittrends ODER ein oder mehrere Pegelverschiebungen oder ein oder mehrere saisonale Impulse oder ein oder mehrere einmalige Impulse erforderlich sind. Außerdem wird davon ausgegangen, dass die Parameter des identifizierten Modells im Zeitverlauf unveränderlich sind und der Fehlerprozess, der dem vorläufig identifizierten Modell zugrunde liegt, im Zeitverlauf ebenfalls unveränderlich ist. Das Ignorieren der oben genannten Punkte ist oft (meiner Meinung nach immer!) Ein Rezept für eine Katastrophe oder genauer gesagt ein "schlecht identifiziertes Modell". Ein klassischer Fall hierfür ist die unnötige logarithmische Transformation, die für die Fluglinienserie und für die Serie, die das OP in seiner überarbeiteten Frage vorlegt, vorgeschlagen wurde. Es ist keine logarithmische Transformation für seine Daten erforderlich, da nur wenige "ungewöhnliche" Werte in den Zeiträumen 198, 207, 218, 219 und 256, die unbehandelt bleiben, den falschen Eindruck erwecken, dass bei höheren Pegeln eine höhere Fehlervarianz vorliegt. Es ist zu beachten, dass "ungewöhnliche Werte" unter Berücksichtigung einer erforderlichen ARIMA-Struktur identifiziert werden, die häufig dem menschlichen Auge entgeht. Transformationen sind erforderlich, wenn die Fehlervarianz über die Zeit nicht konstant ist, NICHT, wenn die Varianz des beobachteten Y über die Zeit nicht konstant ist . Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. 219 und 256, die unbehandelt blieben, erweckten den falschen Eindruck, dass es mit höheren Pegeln eine höhere Fehlervarianz gibt. Es ist zu beachten, dass "ungewöhnliche Werte" unter Berücksichtigung einer erforderlichen ARIMA-Struktur identifiziert werden, die häufig dem menschlichen Auge entgeht. Transformationen sind erforderlich, wenn die Fehlervarianz über die Zeit nicht konstant ist, NICHT, wenn die Varianz des beobachteten Y über die Zeit nicht konstant ist . Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. 219 und 256, die unbehandelt blieben, erweckten den falschen Eindruck, dass es mit höheren Pegeln eine höhere Fehlervarianz gibt. Es ist zu beachten, dass "ungewöhnliche Werte" unter Berücksichtigung einer erforderlichen ARIMA-Struktur identifiziert werden, die häufig dem menschlichen Auge entgeht. Transformationen sind erforderlich, wenn die Fehlervarianz über die Zeit nicht konstant ist, NICHT, wenn die Varianz des beobachteten Y über die Zeit nicht konstant ist . Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. werden unter Berücksichtigung der erforderlichen ARIMA-Struktur identifiziert, die häufig dem menschlichen Auge entweicht. Transformationen sind erforderlich, wenn die Fehlervarianz über die Zeit nicht konstant ist, NICHT, wenn die Varianz des beobachteten Y über die Zeit nicht konstant ist. Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. werden unter Berücksichtigung der erforderlichen ARIMA-Struktur identifiziert, die häufig dem menschlichen Auge entweicht. Transformationen sind erforderlich, wenn die Fehlervarianz über die Zeit nicht konstant ist, NICHT, wenn die Varianz des beobachteten Y über die Zeit nicht konstant ist. Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt. Primitive Verfahren machen immer noch den taktischen Fehler, eine Transformation vor einem der oben genannten Mittel vorzeitig auszuwählen. Man muss bedenken, dass die einfältige Strategie zur Identifizierung von ARIMA-Modellen in den frühen 60er Jahren entwickelt wurde, aber seitdem wurden viele Entwicklungen / Verbesserungen durchgeführt.

Nach dem Veröffentlichen der Daten bearbeitet:

Unter Verwendung von http://www.autobox.com/cms/ wurde ein vernünftiges Modell identifiziert, bei dem es sich um eine Software handelt, die einige meiner oben genannten Ideen enthält, als ich sie mitentwickelte. Bildbeschreibung hier eingebenDer Chow-Test für die Parameterkonstanz schlug vor, die Daten zu segmentieren und die letzten 94 Beobachtungen als Modellparameter zu verwenden, die sich im Laufe der Zeit geändert hatten. Bildbeschreibung hier eingebenDiese letzten 94 Werte ergaben eine Gleichung, Bildbeschreibung hier eingebenbei der alle Koeffizienten signifikant sind. Bildbeschreibung hier eingeben. Die Darstellung der Residuen legt eine vernünftige Streuung nahe, Bildbeschreibung hier eingebenwobei die folgende ACF eine Zufälligkeit nahe legt Bildbeschreibung hier eingeben. Das aktuelle und gereinigte Diagramm leuchtet auf, da es die subtilen ABER signifikanten Ausreißer zeigt. Bildbeschreibung hier eingeben. Schließlich fasst ein Plot von Ist, Fit und Forecast unsere Arbeit zusammen, ALLES OHNE LOGARITHMENBildbeschreibung hier eingeben. Es ist allgemein bekannt, wird aber oft vergessen, dass Machttransformationen wie Drogen sind. Unberechtigter Gebrauch kann Ihnen schaden. Beachten Sie schließlich, dass das Modell eine AR (2), aber keine AR (1) -Struktur hat.

IrishStat
quelle
Warum können wir die Protokolltransformation nicht durchführen? Bitte sehen Sie sich den AirPassengers-Datensatz in R an, der multiplikative Saisonalität aufweist. Wenn Sie das Protokoll erstellen, wird es in additive Saisonalität umgewandelt. Auch wenn wir keine Protokolle aufnehmen, wird der Datensatz eine zunehmende Varianz aufweisen, dh er wird nicht stationär sein. Wie kann ich mit einem solchen Datensatz umgehen, ohne eine Protokolltransformation durchzuführen? Kannst du bitte Erklären?
user2338823
"Es ist keine logarithmische Transformation seiner Daten erforderlich, da nur wenige" ungewöhnliche "Werte in unbehandelten Perioden den falschen Eindruck erwecken, dass bei höheren Pegeln eine höhere Fehlervarianz vorliegt." Die stationäre Annahme der Varianzkonstanz bezieht sich auf die Fehlervarianz und nicht auf die Varianz der Originalserie. Mit der R-Software können Anomalien nicht automatisch identifiziert und einbezogen werden. Siehe autobox.com/cms/index.php/blog Diskussion über die Serie. AND autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat
Der Box-Cox-Test für eine Leistungstransformation geht davon aus, dass keine Ausreißer vorliegen, und kann daher die sich ändernde Varianz fälschlicherweise / versehentlich mit dem erwarteten Wert verknüpfen, was fälschlicherweise auf die Notwendigkeit einer Transformation hindeutet. Siehe Tsays Artikel docplayer.net/… von einem der Box-Studenten als Einführung in den Umgang mit unbehandelter latenter deterministischer Struktur. Übrigens, wenn Sie nicht mit einer Verletzung des ersten Momentes fertig werden / können, können Sie sich darauf falsch einstellen Varianzänderung entweder durch eine Leistungstransformation oder durch GLS, wie Tsay hervorhebt.
IrishStat
14

Um Konzepte zu klären, können Sie durch visuelle Inspektion des ACF oder PACF ein vorläufiges ARMA-Modell auswählen (nicht schätzen). Sobald ein Modell ausgewählt ist, können Sie das Modell durch Maximieren der Wahrscheinlichkeitsfunktion, Minimieren der Quadratsumme oder im Fall des AR-Modells durch die Methode der Momente schätzen.

Ein ARMA-Modell kann nach Inspektion des ACF und des PACF ausgewählt werden. Dieser Ansatz beruht auf den folgenden Tatsachen: 1) Die ACF eines stationären AR-Prozesses der Ordnung p geht mit einer exponentiellen Rate auf Null, während die PACF nach der Verzögerung p Null wird. 2) Für einen MA-Prozess der Ordnung q zeigen der theoretische ACF und der PACF das umgekehrte Verhalten (der ACF schneidet nach der Verzögerung q ab und der PACF geht relativ schnell auf Null).

Es ist normalerweise klar, die Reihenfolge eines AR- oder MA-Modells zu erkennen. Bei Prozessen, die sowohl einen AR- als auch einen MA-Teil enthalten, kann die Verzögerung, bei der sie abgeschnitten werden, verschwimmen, da sowohl der ACF als auch der PACF auf Null abfallen.

Eine Möglichkeit, um fortzufahren, besteht darin, zuerst ein AR- oder MA-Modell (das in ACF und PACF klarer zu sein scheint) niedriger Ordnung anzupassen. Wenn es dann eine weitere Struktur gibt, wird diese in den Residuen angezeigt, sodass die ACF und PACF der Residuen überprüft werden, um festzustellen, ob zusätzliche AR- oder MA-Terme erforderlich sind.

Normalerweise müssen Sie versuchen, mehr als ein Modell zu diagnostizieren. Sie können sie auch anhand des AIC vergleichen.

Der von Ihnen zuerst veröffentlichte ACF und PACF schlugen einen ARMA (2,0,0) (0,0,1) vor, dh einen regulären AR (2) und einen saisonalen MA (1). Der saisonale Teil des Modells wird auf ähnliche Weise wie der reguläre Teil bestimmt, wobei jedoch die Verzögerungen der saisonalen Reihenfolge berücksichtigt werden (z. B. 12, 24, 36, ... in monatlichen Daten). Wenn Sie R verwenden, wird empfohlen, die Standardanzahl der angezeigten Verzögerungen zu erhöhen acf(x, lag.max = 60).

Die Grafik, die Sie jetzt anzeigen, zeigt eine verdächtige negative Korrelation. Wenn dieser Plot auf dem gleichen Plot wie der vorherige Plot basiert, haben Sie möglicherweise zu viele Unterschiede genommen. Siehe auch diesen Beitrag .

Weitere Details finden Sie unter anderem hier: Kapitel 3 in Zeitreihen: Theorie und Methoden von Peter J. Brockwell und Richard A. Davis und hier .

javlacalle
quelle
Du hast recht. Ich habe vielleicht einen Unterschied zu viel genommen. Ich habe jedoch einen Zweifel. Ich habe einen einfachen Unterschied ( i.imgur.com/1MjLzlX.png ) und einen saisonalen (12) ( i.imgur.com/E64Sd7p.png ) in Bezug auf die Protokolldaten gemacht. Was soll ich mir ansehen, das saisonale richtig?
4everlearning
1
@ 4everlearning Richtig, nach Berücksichtigung der saisonalen Unterschiede sehen ACF und PACF näher zu dem aus, was wir von einem stationären Prozess erwarten können. Sie können beginnen, indem Sie eine ARIMA (2,0,0) (0,1,1) in R eingeben arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))und die ACF und PACF der Residuen anzeigen. Beachten Sie auch die weiteren von IrishStat angesprochenen Probleme, mit denen Sie sich in der Analyse befassen sollten.
Javlacalle
Vielen Dank. Wie würde ich vorgehen, um diese AR- und MA-Bestellungen zu finden? Außerdem ergibt das Akaike-Informationskriterium einen negativen Wert für mein Modell. Ich verstehe, dass dies nicht wichtig ist, obwohl ich nicht sicher bin, wie ich es mit anderen Modellen vergleichen soll, sagen wir AIC = -797.74 und AIC = -800.00. Welches ist vorzuziehen?
4everlearning
Sie können die Aufträge anhand der in der obigen Antwort angegebenen Idee bestimmen. Wenn Sie feststellen, dass der ACF relativ schnell auf Null geht und der PACF nach Verzögerung 2 abschneidet, ist wahrscheinlich eine AR (2) -Struktur in den Daten vorhanden. Die umgekehrte Idee gilt für die Erkennung eines MA. Beginnen Sie als allgemeine Empfehlung mit einem Modell niedriger Ordnung und untersuchen Sie die Residuen auf AR- oder MA-Strukturen, die dem ursprünglichen Modell hinzugefügt werden sollen.
Javlacalle
In der Regel ist das Modell umso besser, je niedriger der AIC ist (vorausgesetzt, Sie verwenden die Daten in beiden Modellen im gleichen Maßstab, dh, die Serien sollten in allen Modellen, die Sie vergleichen, entweder in Ebenen oder in Protokollen vorliegen ).
Javlacalle