Wie werden diese acf- und pacf-Diagramme interpretiert?

20

Es folgen ACF- und PACF-Diagramme einer monatlichen Datenreihe. Der zweite Plot ist acf mit ci.type = 'ma':

Bildbeschreibung hier eingeben

Das Fortbestehen hoher Werte in acf plot ist wahrscheinlich ein langfristiger positiver Trend. Die Frage ist, ob dies saisonale Schwankungen darstellen?

Ich habe versucht, verschiedene Websites zu diesem Thema anzuzeigen, bin mir jedoch nicht sicher, ob diese Diagramme eine Saisonabhängigkeit aufweisen.

ACF- und PACF-Plotanalyse

Hilfe bei der Interpretation von ACF- und PACF-Plots

Helfen Sie mit, das folgende Bild von ACF zu verstehen

Autokorrelation und partielle Autokorrelationsinterpretation

Bearbeiten: Das folgende Diagramm zeigt die Verzögerung von bis zu 60:

Bildbeschreibung hier eingeben

Es folgen Darstellungen von diff (my_series):

Bildbeschreibung hier eingeben

Und bis zu Lag 60:

Bildbeschreibung hier eingeben

Bearbeiten: Diese Daten stammen aus: Ist dies eine geeignete Methode zum Testen auf saisonale Auswirkungen in Selbstmordzahlen? Hier haben die Mitwirkenden acf- und pacf-Plots von Original- oder differenzierten Serien nicht als erwähnenswert angesehen (es muss also nicht wichtig sein). An einigen Stellen wurde nur auf acf / pacf-Diagramme von Residuen Bezug genommen.

rnso
quelle
1
Können Sie etwas zu Ihren Daten hinzufügen (z. B. einen einfachen Plot)? Hast du sowas schon probiert stl()?
gung - Wiedereinsetzung von Monica
Ich versuche zu verstehen, wie man die Saisonalität aus acf- und pacf-Plots ermittelt. Ist hierfür eine Überprüfung des Grundplans oder des STL erforderlich? Können wir aus diesen Handlungen nicht etwas bestimmen?
RNSO
1
Das wäre schön. Aus Gründen der Klarheit geht es bei Ihrer Frage nicht wirklich darum, was mit Ihren Daten los ist, sondern darum, was aus diesen Grafiken für sich genommen verstanden werden kann, stimmt das?
gung - Wiedereinsetzung von Monica
1
Ja. Ich muss oft feststellen, ob in meinen Daten Saisonalität vorhanden ist, um zu verstehen, welche Informationen ich aus ACF- und PacF-Plots ableiten kann. Die Darstellungen der stl-Funktion sind einigermaßen leicht zu verstehen, nicht jedoch diese Darstellungen.
RNSO
Ihre Daten haben in der Tat eine gewisse Saisonalität. Bitte beachten Sie meine Antwort an @javlacalle.
IrishStat

Antworten:

9

Das Betrachten von Diagrammen, um zu versuchen, die Daten in ein erratenes Arima-Modell einzugliedern, funktioniert gut, wenn 1: Die Daten keine Ausreißer / Impulse / Pegelverschiebungen, lokalen Zeittrends und keine saisonalen deterministischen Impulse enthalten UND 2) wenn das Arima-Modell solche aufweist konstante Parameter über die Zeit UND 3) wenn die Fehlervarianz aus dem Arima-Modell über die Zeit konstant ist. Wann gelten diese drei Punkte? In den meisten Lehrbuchdatensätzen ist die Arima-Modellierung sehr einfach. Wann ist 1 oder mehr der 3 nicht zutreffend? In jedem Datensatz der realen Welt, den ich je gesehen habe. Die einfache Antwort auf Ihre Frage erfordert den Zugriff auf die ursprünglichen Fakten (die historischen Daten) und nicht auf die sekundären beschreibenden Informationen in Ihren Parzellen. Aber das ist nur meine Meinung!

Nach Erhalt der Daten bearbeitet:

Ich war in einem griechischen Urlaub (habe tatsächlich etwas anderes als eine Zeitreihenanalyse durchgeführt) und konnte die SUICIDE DATA nicht analysieren, sondern nur in Verbindung mit diesem Beitrag. Es ist jetzt angebracht und richtig, dass ich eine Analyse vorlege, um meine Kommentare zu mehrstufigen Modellidentifizierungsstrategien und den Fehlern einer einfachen visuellen Analyse einfacher Korrelationsdiagramme, wie "der Beweis ist im Pudding", zu verfolgen / anhand von Beispielen zu beweisen.

Hier ist die ACF der Originaldaten Bildbeschreibung hier eingebenDie PACF der Originalserie Bildbeschreibung hier eingeben. AUTOBOX http://www.autobox.com/cms/ Eine Software, die ich mitentwickelt habe, verwendet Heuristiken, um ein Startmodell zu identifizieren. In diesem Fall wurde das ursprünglich identifizierte Modell gefunden Bildbeschreibung hier eingeben. Die diagnostische Überprüfung der Residuen dieses Modells ergab eine gewisse Modellsteigerung unter Verwendung einer Pegelverschiebung, von Impulsen und eines saisonalen Impulses. Es ist zu beachten, dass die Pegelverschiebung in oder um die Periode 164 erkannt wird, was nahezu identisch mit einer früheren Schlussfolgerung über die Periode 176 von @forecaster ist. Alle Straßen führen nicht nach Rom, aber einige können Sie in die Nähe bringen!Bildbeschreibung hier eingeben. Testen der Parameterkonstanz Abgelehnte Parameteränderungen im Zeitverlauf. Die Prüfung auf deterministische Änderungen der Fehlervarianz ergab, dass keine deterministischen Änderungen der Fehlervarianz festgestellt wurden. Bildbeschreibung hier eingeben. Der Box-Cox-Test für die Notwendigkeit einer Leistungstransformation war positiv mit der Schlussfolgerung, dass eine logarithmische Transformation notwendig war. Bildbeschreibung hier eingeben. Das endgültige Modell ist da Bildbeschreibung hier eingeben. Die Residuen des endgültigen Modells scheinen frei von jeglicher Autokorrelation zu sein Bildbeschreibung hier eingeben. Die Darstellung der Residuen des endgültigen Modells scheint frei von Gaußschen Verstößen zu sein Bildbeschreibung hier eingeben. Der Plot von Actual / Fit / Forecasts ist hier Bildbeschreibung hier eingebenmit Vorhersagen hierBildbeschreibung hier eingeben

IrishStat
quelle
Danke für deine Antwort. Sind diese Annahmen in realen Daten so wichtig und immer so umstritten, dass acf- und pacf-Diagramme so gut wie nie isoliert interpretiert werden können?
RNSO
Ich muss nie sagen, ABER die Annahmen, die ich aufstellte, würden den visuellen Identifikationsprozess bei Verstößen erheblich erschweren. Ihr klarer Datensatz (für meine alten Augen) ist ein Beispiel dafür. Das Identifizieren eines Anfangsmodells, das Schätzen und das erneute Identifizieren auf der Grundlage der Restdiagnose ist ein mehrstufiger Prozess, der nur in trivialen Fällen durchgeführt wird.
IrishStat
Um es noch einmal zu wiederholen : stats.stackexchange.com/users/48766/javlacalle : Überprüfen, ob Impulse und Pegelverschiebungen UND saisonale Impulse UND lokale Zeittrends UND Konstanz der Fehlervarianz vorliegen, ist ebenfalls erforderlich.
IrishStat
(+1) Gute Analyse der Daten. Was ist jedoch mit der ursprünglichen Frage? Kann in den Daten eine Saisonalität festgestellt werden? Vielleicht kann es aus der Ausgabe abgeleitet werden, die Sie zeigen, aber ich konnte es nicht herausfinden.
Javlacalle
Saisonalität ist in der Laufzeit AR (12) im ARIMA-Modell und im
Saisonimpuls
10

Interpretation der ACF und PACF

Der langsame Abfall der Autokorrelationsfunktion lässt darauf schließen, dass die Daten einem Prozess mit langem Speicher folgen. Die Dauer der Schocks ist relativ beständig und beeinflusst die Daten für mehrere Beobachtungen. Dies spiegelt sich wahrscheinlich in einem weichen Trendmuster in den Daten wider.

Der ACF und der PACF der Ordnung 12 liegen außerhalb der Signifikanzvertrauensbereiche. Dies bedeutet jedoch nicht notwendigerweise das Vorhandensein eines identifizierbaren saisonalen Musters. Der ACF und der PACF anderer saisonaler Aufträge (24, 36, 48, 60) liegen innerhalb der Vertrauensbereiche. Aus der Grafik kann nicht geschlossen werden, ob die Signifikanz des ACF und des PACF der Ordnung 12 auf saisonale oder vorübergehende Schwankungen zurückzuführen ist.

Die zuvor erwähnte Persistenz des ACF lässt darauf schließen, dass möglicherweise erste Unterschiede erforderlich sind, um die Daten stationär zu machen. Die ACF / PACF der differenzierten Reihen sehen jedoch verdächtig aus, eine negative Korrelation wurde möglicherweise durch das Differenzierungsfilter induziert und ist möglicherweise nicht wirklich angemessen. In diesem Beitrag finden Sie einige Details.

Bestimmen Sie, ob Saisonalität vorliegt

Die Analyse von ACF und PACF sollte durch andere Instrumente ergänzt werden, zum Beispiel:

  • Das Spektrum (ein Blick auf die ACF im Frequenzbereich) kann die Periodizität von Zyklen aufdecken, die den größten Teil der Variabilität in den Daten erklären.
  • Passen Sie das grundlegende strukturelle Zeitreihenmodell an und überprüfen Sie, ob die Varianz der saisonalen Komponente im Verhältnis zu den anderen Parametern (in R-Funktion stats::StructTSund Paket- STM) nahe Null ist ) .
  • Saisonalitätstests, basierend auf saisonalen Dummies, saisonalen Zyklen oder den in X-12 beschriebenen und implementierten .
  • Das Vorhandensein von Impulsen und Pegelverschiebungen gemäß IrishStat muss ebenfalls überprüft werden, da diese die Schlussfolgerungen aus den vorherigen Methoden verfälschen können (in R können die Paketanbieter zu diesem Zweck nützlich sein).
javlacalle
quelle
Ich habe den Plot bis zur Verzögerung 60 hinzugefügt. Was wäre der R-Befehl, um "differenzierte Reihen" zu erhalten? Ich werde Diagramme für diff (my_series) hinzufügen.
RNSO
@mso Ich habe meiner vorherigen Antwort wesentliche Änderungen hinzugefügt. Der Befehl für die differenzierte Reihe ist die Funktion diff, die Sie verwendet haben.
Javlacalle
javlacalle - es gab zwei sehr ähnliche Absätze und @rnso versuchte zu helfen, indem er einen entfernte. Ich habe das entfernt, was Sie meiner Meinung nach ersetzen wollten. Könnten Sie bitte überprüfen, ob der richtige Absatz entfernt wurde?
Glen_b
@ Glen_b Danke für die Bearbeitung, ich habe einige Änderungen vorgenommen.
Javlacalle
@ javlacalle, @IrishStat: Bitte beachten Sie bei der Bearbeitung in meiner Frage die Originaldaten.
RNSO