Ich suche nach einer bestimmten Art von ARIMA-Erklärung

25

Diese nur schwer zu finden, aber ich möchte ein lesen gut erklärt ARIMA Beispiel , dass

  • verwendet minimale Mathematik

  • erweitert die Diskussion über die Erstellung eines Modells hinaus auf die Verwendung dieses Modells zur Vorhersage spezifischer Fälle

  • Verwendet Grafiken sowie numerische Ergebnisse, um die Übereinstimmung zwischen prognostizierten und tatsächlichen Werten zu charakterisieren.

rolando2
quelle

Antworten:

7

Mein Vorschlag für eine Einführung in die ARIMA-Modellierung wäre:

Angewandte Zeitreihenanalyse für die Sozialwissenschaften 1980 von R McCleary; RA Hay; EE Meidinger; D McDowall

Dies richtet sich an Sozialwissenschaftler, damit die mathematischen Anforderungen nicht zu streng sind. Auch für kürzere Behandlungen würde ich zwei Sage Green Books vorschlagen (obwohl sie mit dem McCleary-Buch völlig überflüssig sind),

Der Ostrom-Text ist nur eine ARMA-Modellierung und behandelt keine Prognosen. Ich denke nicht, dass sie Ihre Anforderung für die grafische Darstellung von Prognosefehlern erfüllen würden. Ich bin sicher, Sie könnten weitere nützliche Ressourcen ausgraben, indem Sie auch Fragen untersuchen, die mit Zeitreihen in diesem Forum versehen sind.

Andy W
quelle
Das McCleary-Buch ist wunderbar geschrieben, knapp und eine wirklich gute Einführung. Es gibt auch einen wunderbaren, ungewollten Humor im letzten Kapitel, in dem über Hochsprachen wie Fortran gesprochen wird.
Richiemorrisroe
31

Ich werde versuchen, auf den sanften Drang von whuber zu antworten, einfach auf die Frage zu antworten und beim Thema zu bleiben. Wir erhalten 144 monatliche Lesungen einer Serie namens "The Airline Series". Box und Jenkins wurden allgemein dafür kritisiert, eine Prognose zu liefern, die aufgrund der „explosiven Natur“ einer umgekehrten protokollierten Transformation einen hohen Stellenwert hatte.Bildbeschreibung hier eingeben

Visuell haben wir den Eindruck, dass die Varianz der Originalserie mit der Höhe der Serie zunimmt, was auf einen Transformationsbedarf hindeutet. Wir wissen jedoch, dass eine der Voraussetzungen für ein nützliches Modell ist, dass die Varianz der „Modellfehler“ homogen sein muss. Es sind keine Annahmen über die Varianz der Originalserie erforderlich. Sie sind identisch, wenn das Modell einfach eine Konstante ist, dh y (t) = u. Wie https://stats.stackexchange.com/users/2392/probabilityislogic in seiner Antwort auf die Empfehlung zur Erklärung von Heterogenität / Heteroscedasticty so deutlich formuliert hat, ist „eine Sache, die ich immer amüsant finde, diese„ Nicht-Normalität der Daten “, die die Menschen beunruhigen Über. Die Daten müssen nicht normal verteilt werden, der Fehlerbegriff jedoch. “

Frühe Arbeiten in Zeitreihen ließen oft fälschlicherweise Rückschlüsse auf ungerechtfertigte Transformationen zu. Wir werden hier feststellen, dass die Abhilfemaßnahme für diese Daten darin besteht, dem ARIMA-Modell einfach drei Indikator-Dummy-Reihen hinzuzufügen, die eine Anpassung für drei ungewöhnliche Datenpunkte widerspiegeln. Das folgende Diagramm der Autokorrelationsfunktion deutet auf eine starke Autokorrelation bei Lag 12 (0,76) und Lag 1 (0,948) hin. Autokorrelationen sind einfach Regressionskoeffizienten in einem Modell, in dem y die abhängige Variable ist, die durch eine Verzögerung von y vorhergesagt wird.

Bildbeschreibung hier eingeben! Bildbeschreibung hier eingeben

Die obige Analyse legt nahe, dass man die ersten Unterschiede der Reihe modelliert und diese „Restreihen“ untersucht, die hinsichtlich ihrer Eigenschaften mit den ersten Unterschieden identisch sind. Bildbeschreibung hier eingeben

Diese Analyse bestätigt erneut die Idee, dass die Daten ein starkes saisonales Muster aufweisen, das durch ein Modell korrigiert oder modelliert werden könnte, das zwei unterschiedliche Operatoren enthält.

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben

Diese einfache doppelte Differenzierung ergibt eine Menge von Residuen, auch als bereinigte Reihen oder lose als transformierte Reihen bezeichnet, die eine nicht konstante Varianz beweisen, aber der Grund für die nicht konstante Varianz ist der nicht konstante Mittelwert der Residuen Doppelt differenzierte Serien, die am Ende der Serie drei Anomalien vermuten lassen. Die Autokorrelation dieser Serie zeigt fälschlicherweise an, dass „alles in Ordnung“ ist und möglicherweise eine Ma (1) -Anpassung erforderlich ist. Vorsicht ist geboten, da es Anomalien in den Daten gibt, die dazu führen, dass der ACF nach unten verzerrt ist. Dies ist als „Alice im Wunderland-Effekt“ bekannt, dh die Annahme der Nullhypothese ohne erkennbare Struktur, wenn diese Struktur durch eine Verletzung einer der Annahmen maskiert wird.

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben

Wir erkennen visuell drei ungewöhnliche Punkte (117,135,136)

Bildbeschreibung hier eingeben

Dieser Schritt zum Erkennen der Ausreißer wird als Interventionserkennung bezeichnet und kann nach der Arbeit von Tsay einfach oder nicht so einfach programmiert werden.

Bildbeschreibung hier eingebenBildbeschreibung hier eingeben

Wenn wir dem Modell drei Indikatoren hinzufügen, erhalten wir Bildbeschreibung hier eingeben

Wir können dann schätzen

Bildbeschreibung hier eingeben

Und erhalten Sie einen Plot der Residuen und der ACF

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Dies legt nahe, dass wir dem Modell möglicherweise zwei gleitende Durchschnittskoeffizienten hinzufügen. Somit könnte das nächste geschätzte Modell sein.

Bildbeschreibung hier eingeben

Nachgeben

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben Man könnte dann die nicht signifikante Konstante löschen und ein verfeinertes Modell erhalten: Bildbeschreibung hier eingeben

Wir stellen fest, dass keinerlei Leistungstransformationen erforderlich waren, um eine Menge von Residuen mit konstanter Varianz zu erhalten. Beachten Sie, dass die Vorhersagen nicht explosiv sind.

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Mit einer einfachen gewichteten Summe haben wir: 13 Gewichte; 3 ungleich Null und gleich (1.0.1.0., - 1.0)

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Dieses Material wurde auf eine Art und Weise präsentiert, die keine automatische und folglich erforderliche Benutzerinteraktion war, um Modellierungsentscheidungen zu treffen.

IrishStat
quelle
Hallo IrishStat, ich bin es wieder. Ich habe Ihr ausführliches Beispiel geliebt, aber es gibt zwei Passagen, die (zumindest für mich) etwas unklar sind: "Die Autokorrelation dieser Serie zeigt fälschlicherweise an, dass" alles in Ordnung "ist und möglicherweise eine Anpassung von Ma (1) erforderlich ist "und" Dies legt nahe, dass wir dem Modell möglicherweise zwei gleitende Durchschnittskoeffizienten hinzufügen ". Was genau sehen Sie in diesen ACF-Plots, das Sie glauben lässt? Sehen sie nicht beide in Ordnung aus (fast alle Werte liegen innerhalb der "blauen Linien")?
Bruder
: VBruder Ich glaube, ich habe mich "geirrt" mit der Aussage "es könnte ein .... sein". Im zweiten Beispiel gibt es Hinweise auf "schlechtes acf" bei lag1 und lag12, was darauf hindeutet, dass die t2o ma -Koeffizienten möglicherweise benötigt werden . Sie glauben zu sehr an diese Grenzen, da acf91) und acf (12) "gefährlich nah" sind. Sie können mich direkt über meine veröffentlichte E-Mail-Adresse kontaktieren, die Sie über meine Informationen erhalten.
IrishStat
Schön zu schreiben. "ARIMA-Modell, das eine Anpassung für drei ungewöhnliche Datenpunkte widerspiegelt" Sie sagen, dass Sie drei Dummy-Variablen für diese drei Punkte hinzufügen? Wie werden diese drei Ausreißer in zukünftigen Vorhersagen berücksichtigt? (Ich bin mir sicher, dass es einfach ist, ich kenne es einfach nicht.) Außerdem scheinen Ihre Fehlergrenzen mit der Zeit nicht größer zu werden. (Oder vielleicht hängt der Fehler von der Modalität des Schritts ab?) Vielen Dank im Voraus.
Adam
@Adam die drei Dummy-Variablen spielen keine Rolle bei der Vorhersage, da zukünftige Werte alle 0 sind. Ja, die dargestellten Fehlergrenzen sind falsch. Wir haben diesen Fehler behoben und jetzt weist AUTOBOX mit der Zeit immer größere Fehlergrenzen auf. Ich bin einer der Entwickler von AUTOBOX. .
IrishStat
@IrishStat "Die drei Dummy-Variablen spielen bei der Vorhersage keine Rolle, da alle zukünftigen Werte 0 sind." Bedeutet dies im Wesentlichen, dass sie aus den Daten entfernt werden? Sie müssen einen Einfluss auf die Vorhersagegrenzen haben?
Adam
15

Das habe ich in Kapitel 7 meines Lehrbuchs von 1998 mit Makridakis & Wheelwright versucht . Ob es mir gelungen ist oder nicht, überlasse ich anderen die Entscheidung. Sie können einen Teil des Kapitels online über Amazon lesen (ab p311). Suchen Sie im Buch nach "ARIMA", um Amazon davon zu überzeugen, Ihnen die relevanten Seiten anzuzeigen.

Update: Ich habe ein neues Buch, das kostenlos und online ist. Das ARIMA-Kapitel ist da .

Rob Hyndman
quelle
3

Ich würde Forecasting with Univariate Box - Jenkins Models: Konzepte und Fälle von Alan Pankratz empfehlen . Dieses klassische Buch enthält alle Funktionen, nach denen Sie gefragt haben:

  • verwendet minimale Mathematik
  • erweitert die Diskussion über die Erstellung eines Modells hinaus auf die Verwendung dieses Modells zur Vorhersage spezifischer Fälle
  • Verwendet Grafiken sowie numerische Ergebnisse, um die Übereinstimmung zwischen prognostizierten und tatsächlichen Werten zu charakterisieren.

Der einzige Nachteil ist, dass es 1983 gedruckt wurde und möglicherweise keine neuen Entwicklungen aufweist. Der Verlag kommt mit einer 2. Auflage im Januar 2014 mit Updates.

Prognostiker
quelle
Ich würde auch Alan Pankratz 'anderes Buch empfehlen: Forecasting with Dynamic Regression Models. Sehr ähnliches Material, deckt aber etwas mehr Boden ab; wenn auch weniger detailliert auf der Seite der Box-Jenkins Dinge. Schön zu hören, dass es im Januar 2014 eine zweite Ausgabe geben wird!
Graeme Walsh
-4

Ein ARIMA-Modell ist einfach ein gewichteter Durchschnitt. Es beantwortet die doppelte Frage;

  1. Wie viele Punkte (k) sollte ich verwenden, um einen gewichteten Durchschnitt zu berechnen?

und

  1. Genau was sind die k Gewichte

Es beantwortet das Gebet des Mädchens, um zu bestimmen, wie es sich auf frühere Werte (und frühere Werte ALLEIN) einstellen soll, um die Reihe (die tatsächlich durch nicht spezifizierte kausale Variablen verursacht wird) zu projizieren. Somit ist ein ARIMA-Modell das kausale Modell eines armen Mannes.

IrishStat
quelle
-1 Diese Antwort scheint nicht auf die Frage zu antworten, die nach einem "gut erklärten ... * Beispiel *" sucht.
whuber
@whuber: Das OP hat nach einer Antwort gefragt, die "minimale Mathematik verwendet". Meine Antwort enthielt eine detaillierte Beschreibung von Minimal Math und war motiviert, ARIMA-Modelle in alltäglichen Worten zu erklären. Dies wird niemals getan, da sich die Leute aus der Mathe-Theorie auf die "High-End-Erklärung" mit Polynomen, differenzierenden Operatoren, nichtlinearer Optimierung usw. konzentrieren.
IrishStat
@Irish Ich bin mit der Motivation einverstanden, die Mathematik niedrig zu halten, insbesondere wenn der Benutzer dies wünscht. Diese Antwort scheint jedoch eine andere Frage zu beantworten: "Was ist ARIMA?". Die Besonderheit der ursprünglichen Frage zeigt auch, dass das OP eine gute Vorstellung davon hat, was ARIMA ist und wofür es gut ist. Sie wollen es in Aktion sehen. Ich wette, Sie könnten leicht eine solche Fallstudie beisteuern :-).
whuber
: whuber: Das wäre für mich sehr einfach gewesen und ich könnte das auch tun.
IrishStat
@Irish Ich freue mich darauf, es zu sehen. Darüber hinaus - dieses Thema ist hier nicht aufgetaucht, aber es ist an anderer Stelle aufgetaucht - sind solche Beiträge potenziell leistungsstärker und wertvoller, um die Menschen wissen zu lassen, was Sie tun können, als dies bei vielen anderen offenen Formen des Marketings der Fall ist.
whuber