Was zeigt das Autokorrelationsdiagramm (Pandas)?

12

Ich bin ein Anfänger und versuche zu verstehen, was ein Autokorrelationsdiagramm zeigt.

Ich habe mehrere Erklärungen aus verschiedenen Quellen wie dieser Seite oder der zugehörigen Wikipedia-Seite gelesen , die ich hier nicht zitiere.

Ich habe diesen sehr einfachen Code, in dem ich Daten für ein Jahr in meinem Index habe und die Werte für jeden Index einfach von 0 auf 365 erhöht werden. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365)

import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt

dr = pd.date_range(start='1984-01-01', end='1984-12-31')

df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()

wo das gedruckte Diagramm sein wird

Geben Sie hier die Bildbeschreibung ein

Ich kann verstehen und sehen, warum die Grafik 1.00seitdem beginnt :

Autokorrelation mit Verzögerung Null ist immer gleich 1, da dies die Autokorrelation zwischen jedem Term und sich selbst darstellt. Wert und Wert mit Verzögerung Null sind immer gleich.

Das ist schön, aber warum hat dieser Graph bei Lag 50 zum Beispiel einen Wert um 0,65? Und warum fällt es unter 0? Wenn ich meinen Code nicht angezeigt hätte, könnte ich daraus schließen, dass dieses Autokorrelationsdiagramm eine Zeitreihe mit steigenden Werten zeigt? Wenn ja, können Sie versuchen, einem Anfänger zu erklären, wie Sie daraus schließen können?

Koray Tugay
quelle

Antworten:

12

Ein Blick auf den Schätzer für die Autokovarianzfunktion bei Verzögerung kann nützlich sein (beachten Sie, dass die Autokorrelationsfunktion einfach eine verkleinerte Version der Autokovarianzfunktion ist).h

γ^(h)=1nt=1nh(xt+hx¯)(xtx¯)

Die Idee ist, dass wir für jede Verzögerung die Reihe durchlaufen und prüfen, ob der Datenpunkt positiv oder negativ von den Kovarianten abweicht (dh wenn über dem Mittelwert der Reihe liegt, geht auch über oder unter ?).hhtt+h

Ihre Serie ist eine monoton ansteigende Serie und hat einen Mittelwert von . Mal sehen, was passiert, wenn .183h=130

Beachten Sie zunächst, dass wir nur die Autokovarianzfunktion berechnen bis zu dem Zeitpunkt 234, da , wenn , .t=234t+h=365

Des Weiteren , dass Notiz von bis , haben wir , dass ist auch unter dem Mittelwert (seit 53 + 130 = 183 , die der Mittelwert der Reihe ist).t=1t=53t+h

Und dann ist die geschätzte Korrelation von bis negativ, da sie sich negativ ändert.t=54t=182

Schließlich ist von bis die geschätzte Korrelation wieder positiv, da und beide über dem Mittelwert liegen.t=183t=234tt+h

Sehen Sie, wie dies dazu führen würde, dass die Korrelation aufgrund der ungefähr gleichen Beiträge zur Autokovarianzfunktion aus den positiv kovariierenden Punkten und den negativ kovariierenden Punkten gemittelt wird?

Möglicherweise stellen Sie fest, dass es mehr Punkte gibt, die negativ kovariieren, als Punkte, die positiv kovariieren. Intuitiv sind die positiv kovariierenden Punkte jedoch größer (da sie weiter vom Mittelwert entfernt sind), während die negativ kovariierenden Punkte eine geringere Größe zur Autokovarianzfunktion beitragen, da sie näher am Mittelwert auftreten. Dies führt somit zu einer Autokovarianzfunktion von ungefähr Null.

Kevin Li
quelle