Zufällige Gehschätzung mit AR (1)

10

Wenn ich einen zufälligen Spaziergang mit einem AR (1) schätze, ist der Koeffizient sehr nahe an 1, aber immer kleiner.

Was ist der mathematische Grund, warum der Koeffizient nicht größer als eins ist?

Marco
quelle
Ich habe es mit der Matlab-Toolbox und auch mit meinem Skript für Arima versucht (wobei der Koeffizient auf [-10,10] begrenzt ist und das Ergebnis dasselbe ist). Ich versuche es mit einem einfachen OLS und das Ergebnis ist das gleiche.
Marco
Die Schätzung ist nach unten voreingenommen, wir müssen Dickey und Fuller Papier lesen.
Marco

Antworten:

12

Wir schätzen durch OLS das Modell

xt=ρxt1+ut,E(ut{xt1,xt2,...})=0,x0=0

Für eine Stichprobe der Größe T ist der Schätzer

ρ^=t=1Txtxt1t=1Txt12=ρ+t=1Tutxt1t=1Txt12

ρ=1

xt=xt1+utxt=i=1tui

ρ^168ρ^<1

Geben Sie hier die Bildbeschreibung ein

Mean:0.0017773Median:0.00085984Minimum: 0.042875Maximum: 0.0052173Standard deviation: 0.0031625Skewness: 2.2568Ex. kurtosis: 8.3017

Dies wird manchmal als "Dickey-Fuller" -Distribution bezeichnet, da es die Basis für die kritischen Werte ist, die zur Durchführung der gleichnamigen Unit-Root-Tests verwendet werden.

Ich erinnere mich nicht einen Versuch zu sehen , zu schaffen , Intuition für die Form der Stichprobenverteilung. Wir betrachten die Stichprobenverteilung der Zufallsvariablen

ρ^1=(t=1Tutxt1)(1t=1Txt12)

utρ^1ρ^1

T=5

Wenn wir unabhängige Produktnormalen addieren, erhalten wir eine Verteilung, die um Null herum symmetrisch bleibt. Zum Beispiel:

Geben Sie hier die Bildbeschreibung ein

Aber wenn wir nicht unabhängige Produktnormalen summieren, wie es unser Fall ist, erhalten wir

Geben Sie hier die Bildbeschreibung ein

die nach rechts geneigt ist, aber mit größerer Wahrscheinlichkeit Masse den negativen Werten zugeordnet. Und die Masse scheint noch mehr nach links verschoben zu werden, wenn wir die Stichprobengröße erhöhen und der Summe mehr korrelierte Elemente hinzufügen.

Der Kehrwert der Summe nicht unabhängiger Gammas ist eine nicht negative Zufallsvariable mit positivem Versatz.

ρ^1

Alecos Papadopoulos
quelle
Wow, schöne Analyse! Können Sie angeben, gegen welche der Standard-OLS-Annahmen hier verstoßen wird?
Richard Hardy
@ RichardHardy Danke. Ich werde später zurückkehren, um auf Ihren Kommentar zu antworten.
Alecos Papadopoulos
Ich bin immer noch neugierig auf die OLS-Annahmen ... Vielen Dank im Voraus!
Richard Hardy
Xt+1=αXt+ϵXt+1Xt
ρ^<1ρ^1
6

Dies ist keine wirkliche Antwort, aber zu lang für einen Kommentar, also poste ich dies trotzdem.

Bei einer Stichprobengröße von 100 (mit "R") konnte ich zweimal von hundert einen Koeffizienten von mehr als 1 erhalten:

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Die Realisierungen 84 und 95 haben einen Koeffizienten über 1, so dass er nicht immer unter eins liegt. Es besteht jedoch eindeutig die Tendenz zu einer nach unten gerichteten Schätzung. Die Fragen bleiben, warum ?

Bearbeiten: Die obigen Regressionen enthielten einen Intercept-Term, der nicht zum Modell zu gehören scheint. Sobald der Achsenabschnitt entfernt ist, erhalte ich viele weitere Schätzungen über 1 (3158 von 10000) - aber immer noch deutlich unter 50% aller Fälle:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
Richard Hardy
quelle
genau, nicht "immer" minderjährig, aber in den meisten Fällen. Es ist offensichtlich ein falsches Ergebnis. warum der Grund?
Marco
2
xtxt1