Frage zur Autokovarianzfunktion der Probe

10

Ich lese ein Zeitreihenanalysebuch und die Formel für die Autokovarianz von Stichproben ist im Buch wie folgt definiert:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

mitfür . ist der Mittelwert.γ^(h)=γ^(h)xh=0,1,...,n1x¯

Kann jemand intuitiv erklären, warum wir die Summe durch und nicht durch teilen ? Das Buch erklärt, dass dies daran liegt, dass die obige Formel eine nicht negative bestimmte Funktion ist und daher das Teilen durch bevorzugt wird, aber das ist mir nicht klar. Kann jemand das vielleicht beweisen oder ein Beispiel oder etwas zeigen?n - h nnnhn

Für mich wäre es zunächst intuitiv, durch zu teilen . Ist dies ein unvoreingenommener oder voreingenommener Schätzer der Autokovarianz?nh

jjepsuomi
quelle
1
Wenn Ihre Zeitreihe genau und alle anderen , oder unbekannt sind, muss die Summe notwendigerweise bei aufhören, wenn auftritt die Summe: Der nächste Term (für ), der in der Summe enthalten sein würde, würde und ist nicht Teil des Beispiels. x i i < 1 i > n t = n - h x t + h = x n t = n - h + 1 x n - h + 1 + h = x n + 1 x n + 1x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1xnh+1+h=xn+1xn+1
Dilip Sarwate
@Dilip Ich glaube nicht , das ist das Problem: die Frage betrifft , ob zu dividieren durch oder n - h in der Definition von γ . nnhγ^
whuber

Antworten:

14

wird zum Erstellen Kovarianzmatrizen: gegeben "Zeiten"t1,t2,...,tk, schätzt esdaß die Kovarianz des ZufallsvektorsXt1,Xt2,...,Xtkaus dem (erhalten Zufallsfeld zu diesen Zeiten) die Matrix( γ (ti-tj),1i,jk)γ^t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk). Für viele Probleme wie die Vorhersage ist es entscheidend, dass alle diese Matrizen nicht singulär sind. Als mutmaßliche Kovarianzmatrizen können sie offensichtlich keine negativen Eigenwerte haben, daher müssen sie alle positiv-definitiv sein.

Die einfachste Situation, in der die Unterscheidung zwischen den beiden Formeln

γ^(h)=n- -1t=1n- -h(xt+h- -x¯)(xt- -x¯)

und

γ^0(h)=(n- -h)- -1t=1n- -h(xt+h- -x¯)(xt- -x¯)

erscheint, wenn die Länge 2 hat ; sagen wir, x = ( 0 , 1 ) . Für t 1 = t und t 2 = t + 1 ist es einfach zu berechnenx2x=(0,1)t1=tt2=t+1

γ^0=(14- -14- -1414),

das ist einzigartig, während

γ^=(14- -18- -1814)

welcher Eigenwert und 1 / 8 , von wo es positiv definit ist.3/.81/.8

Ein ähnliches Phänomen passiert , für , wobei γ positiv-definite aber γ 0 --beim auf die Zeiten angewandt t i = ( 1 , 2 , 3 , 4 ) , Say - -degenerates in eine Matrix des Rangs 1 (seine Einträge wechseln zwischen 1 / 4 und - 1 / 4 ).x=(0,1,0,1)γ^γ^0tich=(1,2,3,4)11/.4- -1/.4

(Hier gibt es ein Muster: Probleme treten für jedes der Form auf ( a , b , a , b , ... , a , b ) .)x(ein,b,ein,b,,ein,b)

In den meisten Anwendungen ist die Reihe von Beobachtungen so lang, dass für die meisten interessierenden h - die viel kleiner als n sind - der Unterschied zwischen n - 1 und ( n - h ) - 1 keine Konsequenz hat. In der Praxis ist die Unterscheidung also keine große Sache, und theoretisch überschreibt das Bedürfnis nach positiver Bestimmtheit stark jeden möglichen Wunsch nach unvoreingenommenen Schätzungen.xthnn- -1(n- -h)- -1

whuber
quelle
1
Ich denke, es ist wichtig zu beachten, dass beide Schätzer voreingenommene Schätzer sind, selbst wenn Sie sie durch nh teilen.
Ran
@Ran Obwohl Sie richtig sind, dass diese Schätzer voreingenommen sind, bin ich nicht der Meinung, dass dies ein wichtiges Thema ist: Wie im letzten Absatz erwähnt, ist ein kleiner Grad an Voreingenommenheit die geringste Sorge von irgendjemandem. Die unverzerrter Schätzer, unter Verwendung von , kaum unterscheidet sich von γ oder γ 0 . (n- -h- -1)- -1γ^γ^0
whuber
2
Sehr schöne Antwort +1. Vielleicht ist es sinnvoll , den Punkt hinzuzufügen , dass , während V γ ( h ) = O ( 1 / n ) , so dass , wenn h nahe an ist n der Schätzer & ggr; 0 ( h ) kann mit Fehlern behaftet sein, während γ ( h )Vγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)wird gleichmäßig kleine Stichprobenschwankungen haben . Siehe z. B. Priestly (1981) "Spektralanalyse und Zeitreihen", S. 324 für eine ausführliche Erörterung dieses Punktesh
Colin T Bowers,