Ich habe in der Literatur zwei Definitionen für die Autokorrelationszeit einer schwach stationären Zeitreihe gefunden:
Dabei ist die Autokorrelation bei Verzögerung . k
Eine Anwendung der Autokorrelationszeit besteht darin, die "effektive Stichprobengröße" zu ermitteln: Wenn Sie Beobachtungen einer Zeitreihe haben und die Autokorrelationszeit , können Sie so tun, als hätten Sie
unabhängige Stichproben anstelle von korrelierten, um den Mittelwert zu ermitteln. Das Schätzen von von Daten ist nicht trivial, es gibt jedoch einige Möglichkeiten, dies zu tun (siehe Thompson 2010 ).
Die Definition ohne absolute Werte, , scheint in der Literatur üblicher zu sein; aber es gibt die Möglichkeit von . Mit R und dem "Coda" -Paket:τ a < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
Die "effectiveSize" -Funktion in "coda" verwendet eine Definition der Autokorrelationszeit , die oben zu äquivalent ist. Es gibt einige andere R - Pakete gibt , die Compute effektive Stichprobengröße oder Autokorrelation Zeit, und alle diejenigen , die ich habe give Ergebnisse versucht konsistent mit diesem: dass ein AR (1) -Prozess mit einem negativen AR - Koeffizienten hat mehr effektive Proben als die korrelierte Zeitfolgen. Das scheint seltsam.
Offensichtlich kann dies in der Definition der Autokorrelationszeit niemals vorkommen .
Was ist die korrekte Definition der Autokorrelationszeit? Stimmt etwas nicht mit meinem Verständnis der effektiven Stichprobengrößen? Das oben gezeigte Ergebnis scheint falsch zu sein ... was ist los?
quelle
Antworten:
Erstens ist die angemessene Definition des Begriffs "effektive Stichprobengröße" IMO mit einer ganz bestimmten Frage verbunden. Wenn sind identisch mit dem Mittelwert verteilt μ und die Varianz 1 der empirische Mittelwert μ = 1X1,X2,… μ
ist ein unverzerrter Schätzer vonμ. Aber was ist mit seiner Varianz? FürunabhängigeVariablen beträgt die Varianzn-1. Für eine schwach stationären Zeitreihen, die Varianz von μ ist
1
Bei negativer Korrelation zwischen Beobachtungen ist es durchaus möglich, dass die Varianz kleiner als ( n eff > n ). Dies ist eine bekannte Varianzreduktionstechnik in der Monto-Carlo-Integration: Wenn wir anstelle der Korrelation 0 eine negative Korrelation zwischen den Variablen einführen, können wir die Varianz reduzieren, ohne die Stichprobengröße zu erhöhen.n−1 neff>n
quelle
siehe http://arxiv.org/pdf/1403.5536v1.pdf
und
https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf
für eine effektive Probengröße. Ich denke, die alternative Formulierung unter Verwendung des Verhältnisses von Stichprobenvarianz und asymptotischer Markov-Kettenvarianz über den Chargenmittelwert ist ein geeigneterer Schätzer.
quelle