Gibt es einen Unterschied zwischen einer autokorrelierten Zeitreihe und seriell autokorrelierten Fehlern?

9

Ich bin mir ziemlich sicher, dass mir hier etwas Offensichtliches fehlt, aber ich bin ziemlich verwirrt mit verschiedenen Begriffen im Bereich der Zeitreihen. Wenn ich es richtig verstehe, sind seriell autokorrelierte Fehler ein Problem in Regressionsmodellen (siehe zum Beispiel hier ). Meine Frage ist nun, was genau einen autokorrelierten Fehler definiert. Ich kenne die Definition der Autokorrelation und kann die Formeln anwenden, aber dies ist eher ein Problem des Verständnisses mit Zeitreihen in Regressionen.

Nehmen wir zum Beispiel die Zeitreihe der Tagestemperaturen: Wenn es heute ein heißer Tag ist (Sommerzeit!), Ist es wahrscheinlich auch morgen heiß und umgekehrt. Ich glaube, ich habe ein Problem damit, dieses Phänomen als "seriell autokorrelierte Fehler" zu bezeichnen, weil es mich nicht als Fehler, sondern als erwartet empfindet.

Nehmen wir formeller einen Regressionsaufbau mit einer abhängigen Variablen und einer unabhängigen Variablen x t und dem Modell an.ytxt

yt=α+βxt+ϵt

Ist es möglich, dass autokorreliert ist, während ϵ t iid ist? Wenn ja, was bedeutet das für all diese Methoden, die Standardfehler für die Autokorrelation anpassen? Müssen Sie das noch tun oder gelten sie nur für autokorrelierte Fehler? Oder würden Sie die Autokorrelation immer in einer solchen Einstellung im Fehlerterm modellieren, sodass es im Grunde keinen Unterschied macht, ob x t autokorreliert ist oder e t ?xtϵtxtet

Dies ist meine erste Frage hier. Ich hoffe, es ist nicht zu verwirrend und ich hoffe, ich habe nichts Offensichtliches verpasst ... Ich habe auch versucht, es zu googeln und einige interessante Links gefunden (zum Beispiel hier auf SA ), aber nichts hat mir wirklich geholfen.

Christoph_J
quelle

Antworten:

7

ϵnicht Null sein. Nehmen wir an, Sie modellieren die Temperatur als Funktion der Zeit, aber sie wird auch von Dingen wie Vulkanausbrüchen beeinflusst, die Sie in Ihrem Modell nicht berücksichtigt haben. Der Vulkan sendet Staubwolken aus, die die Sonne blockieren und die Temperatur senken. Diese zufällige Störung bleibt über mehr als einen Zeitraum bestehen. Dadurch erscheint Ihr Zeittrend weniger steil als er sein sollte. Um fair zu sein, ist es wahrscheinlich so, dass sowohl Autoregression als auch autokorrelierte Fehler ein Problem mit der Temperatur sind.

Autokorrelierte Fehler können auch in räumlichen Querschnittsdaten auftreten, bei denen ein zufälliger Schock, der die Wirtschaftstätigkeit in einer Region beeinflusst, auf andere Gebiete übergreift, da diese wirtschaftliche Bindungen aufweisen. Ein Schock, der Trauben in Kalifornien tötet, wird auch den Absatz von Rindfleisch aus Montana senken. Sie können auch autokorrelierte Störungen auslösen, wenn Sie eine relevante und autokorrelierte unabhängige Variable in Ihrem Zeitreihenmodell weglassen.

Dimitriy V. Masterov
quelle
xt
1
@Christoph_J Idealerweise möchten Sie sich gegen ein oder mehrere Zeitverzögerungen für das saisonale Muster und die vulkanische Aktivität zurückbilden . Wenn wir stattdessen die Ursache für die autokorrelierten Fehler ignorieren, kann ein Modell mit gleitendem Durchschnitt helfen. In diesem Fall wäre es ein ARIMA-Modell.
Robert Kubrick
1
ytMA(1)
Danke euch beiden. @ DimitriyV.Masterov Zu diesem Zeitpunkt habe ich kein wirkliches Problem. Aus diesem Grund habe ich versucht, mein Problem so allgemein wie möglich zu gestalten. Ich denke, ich kämpfe nur mit Zeitreihen einerseits und Regressionen andererseits. Manchmal scheinen es zwei völlig unterschiedliche Themen zu sein; Wenn ich es richtig verstehe, gibt es Fälle, in denen Sie nur versuchen, eine Zeitreihe zu modellieren (wie viele Verzögerungen hat sie? Ist sie stationär? usw.). Im anderen Extremfall scheint man manchmal nur eine Zeitreihe auf der anderen Seite zu regressieren, ohne der Tatsache, dass es sich um einen TS handelt, viel Aufmerksamkeit zu schenken.
Christoph_J
Und ich habe manchmal Probleme, was der beste Weg für die Zukunft ist: Muss ich zuerst den autoregressiven Prozess modellieren oder kann ich einfach die Autokorrelation in den Fehlerbegriffen korrigieren? Was meine Frage betrifft, hat Ihre und Roberts Antwort sehr geholfen, und ich denke, dass in meinem Bereich (Faktormodelle im Finanzwesen) seriell autokorrelierte Fehler und nicht Autoregression behandelt werden sollten. Wenn eine andere Frage auftaucht, würde ich eine neue Frage stellen.
Christoph_J
4

R2

Von allen Annahmen in der linearen Regression (Homoskedastizität, Unabhängigkeit der Residuen, Linearität der Beziehung IVs -> DV, Normalität der Residuen) sind Linearität und Unabhängigkeit der Residuen diejenigen, die die Ergebnisse bei Verletzung schwerwiegender beeinflussen.

Robert Kubrick
quelle