Vorhersage nichtstationärer Zeitreihen

8

Ich möchte die instationären Zeitreihen vorhersagen, die mehrere wichtige a-priori-Annahmen beinhalten, die sich aus der Untersuchung von Instanzen solcher Reihen ergeben.

  1. Ich habe eine zeitgemittelte Ein-Punkt-Wahrscheinlichkeitsverteilungsfunktion konstruiert, die durch die Normalverteilung angenähert wird. P ( x ) = 1 Unter diesem Gesichtspunkt möchte ich, dass die Prognosenicht überschreitet, wenn. Mit anderen Worten muss die Varianz vonbegrenzt werden.

    p^(x)=12πσ2exp(x22σ2)
    l z t ( l )zt(l)lzt(l)
  2. Die durchschnittliche Zweipunktwahrscheinlichkeitsverteilungsfunktion ebenfalls konstruiert, was zur Identifizierung der Autokorrelationsfunktion führte. lieferte .ρ(j)Aj-α0<α<0,5p^(xi,i;xj,j)ρ(j)Ajα0<α<0.5

Der Identifizierungsprozess von Box-Jenkins führte mich jedoch zunächst zum -ModellARIMA(0,1,3)

  1. Ich kann die Varianz nicht bis (was sich aus Gleichungen für BJ-Gewichte ). Gleichzeitig kann ich nicht verwenden, da die anfängliche Autokorrelation langsam abnimmt (was laut BJ wahrscheinlich ein Beweis für Nichtstationarität ist). Dies ist das Haupthindernis für mich.j d = 0d0ψjd=0

  2. Visuell stimmt die Simulation von nicht mit dem Verhalten meiner Proben überein. Und Korrelationen der ersten Differenz der Reihe stimmen schlecht mit den aus dem Modell folgenden Korrelationen überein.ARIMA(0,1,3)

  3. Die Analyse der Residuen zeigt signifikante Korrelationen ab Verzögerung 3. Aus diesem Grund ist meine anfängliche Aussage zu falsch.ARIMA(0,1,3)

Der Versuch , unterschiedliche passen Modelle, wie ich sehe , dass es nahe der Verzögerung signifikant Residualkorrelationen ist für jeden . Es kann davon ausgegangen werden, dass ich ein Modell (als einschränkende Auswahl) benötige , zum Beispiel gebrochenes ARIMA.p p A R I M A ( , 0 , q )ARIMA(p,0,0)ppARIMA(,0,q)

Aus [1] habe ich etwas über fraktionierte Modelle gelernt die .A R I M A ( , 0 , q )ARIMA(p,d,q)ARIMA(,0,q)

  1. Ich habe keine GNU R-Pakete gefunden, die fehlende Werte dafür unterstützen. Fehlende Werte scheinen eine Art Herausforderung zu sein.

  2. Die Veröffentlichungen zu fraktioniertem ARIMA sind ziemlich selten. Werden solche Bruchmodelle wirklich verwendet? Vielleicht gibt es einen guten Ersatz für ARIMA-Modelle für meine Bedürfnisse? Die Prognose ist nicht mein Hauptfach, ich habe nur pragmatisches Interesse.

  3. Aus verschiedenen Literaturstellen (zum Beispiel [2]) habe ich gelernt, dass es praktisch unmöglich ist, sich zwischen fraktioniertem ARIMA und Modellen mit "Pegelverschiebung" zu entscheiden. Ich habe jedoch nicht das Paket für GNU R gefunden, das für Level-Shift-Modelle geeignet ist.

[1]: Granger, Joyeux.: J. von Zeitreihen anal. vol. 1 nr. 1 1980, S.15

[2]: Grassi, de Magistris.: "Wenn langes Gedächtnis auf den Kalman-Filter trifft: Eine vergleichende Studie", Computational Statistics and Data Analysis, 2012, im Druck.

Update: um meinen eigenen Fortschritt zu rendern und @IrishStat zu beantworten

Meine Aussage zur Zweipunktwahrscheinlichkeitsverteilung ist im Allgemeinen falsch. Die auf diese Weise konstruierte Funktion hängt von der vollen Serienlänge ab. Es gibt also ein wenig zu extrahieren. Zumindest hängt der Parameter von der vollen Serienlänge ab.α

Die Listen 2 und 3 wurden ebenfalls aktualisiert.

Meine Daten sind als dat - Datei zur Verfügung hier .

Im Moment bezweifle ich zwischen FARIMA und Pegelverschiebungen, und ich kann immer noch keine geeignete Software finden, um diese Optionen zu überprüfen. Dies ist auch meine erste Erfahrung mit der Modellidentifikation, daher wird jede Hilfe geschätzt.

0x2207
quelle
Ich bin ein bisschen verwirrt von Ihren Daten. Zum Beispiel, was ist die Bedeutung von 6325.76 ... und -.247831. Was wird beobachtet? Sind die Daten chronologisch und zeitlich gleich verteilt? 6325,76666666667 -,247831949032426 „770“ 6326,78333333333 0,0282060159445925 „771“ 6327,78333333333 0,162348034962085 „772“ 6328,78333333333 -,206057978534193 „773“ 6329,78333333333 -,427928912063427 „774“ 6330,78333333333 NA „775“ 6331,78333333333 NA „776“ 6332,78333333333 NA „777“ 6333,78333333333 NA „778“ NA 6334,78333333333
IrishStat
Dies ist das Ergebnis von write.table (). Die erste Spalte ist "Zeilenname" (bedeutungslos), die zweite ist der Zeitpunkt, der dritte Wert. Es sind fast gleich große Beobachtungen, viele Daten fehlen.
0x2207
Zeitbereichsansätze erfordern Daten mit gleichem Abstand, ohne dass Werte fehlen. Aus pädagogischen Gründen werde ich eine Teilmenge der Daten nehmen UND davon ausgehen, dass sie gleichmäßig verteilt sind, und versuchen, sie zu charakterisieren.
IrishStat

Antworten:

5

Ich habe noch nie ein Modell wie Box-Jenkins gesehen. Der Identifizierungsprozess führte mich zum ARIMA (0,1,3) -Modell, aber ich hatte noch nie einen schwarzen Schwan gesehen, bis ich nach Australien ging. Bitte posten Sie Ihre Daten, da dies möglicherweise auf die Notwendigkeit hinweist

  1. Interventionserkennung, die zu Pegelverschiebungen, lokalen Zeittrends et al
  2. Zeitvariable Parameter
  3. Zeitvariable Fehlervarianz

Wenn Ihre Daten vertraulich sind, skalieren Sie sie einfach.

OK, nachdem ich Ihre Daten erhalten habe (ca. 80000 Messwerte), habe ich ab Punkt 6287 805 Beobachtungen ausgewählt und erhalten.

Geben Sie hier die Bildbeschreibung ein. In Periode 137 wurde ein signifikanter Änderungspunkt festgestellt, was auf zeitlich veränderliche Parameter hindeutet. Die verbleibenden 668 Beobachtungen deuten auf ein pdq-ARIMA-Modell (3,0,0) mit einer Stufenverschiebung hin, das Ihre vorläufigen Schlussfolgerungen zu Verzögerung 3 stützt Geben Sie hier die Bildbeschreibung ein. Das Diagramm "Ist / Anpassung / Prognose" ist Geben Sie hier die Bildbeschreibung eindas Residuendiagramm Geben Sie hier die Bildbeschreibung einund der ACF der Residuen ist Geben Sie hier die Bildbeschreibung ein. Da der ACF der Residuen in den Perioden 5 und 10 eine starke Struktur aufweist, können Geben Sie hier die Bildbeschreibung einSie die saisonale Struktur in Lag 5 weiter untersuchen. Ich hoffe, dies hilft.

IrishStat
quelle