Es mag eine komische Frage sein, aber als Anfänger frage ich mich, warum wir die Regression verwenden, um eine Zeitreihe abzutrennen, wenn eine der Annahmen der Regression darin besteht, dass die Daten, auf die die Regression angewendet wird, a sind nicht iid?
regression
time-series
trend
iid
FarrukhJ
quelle
quelle
Antworten:
Sie sind scharfsinnig in der Annahme, dass es möglicherweise einen Konflikt zwischen den klassischen Annahmen der linearen Regression der kleinsten Quadrate und der seriellen Abhängigkeit gibt, die üblicherweise in der Zeitreiheneinstellung zu finden ist.
Man betrachte die Annahme 1.2 (Strikte Exogenität) von Fumio Hayashis Ökonometrie .
Dies impliziert wiederum, dass , dass jeder Rest ϵ i orthogonal zu jedem Regressor x j ist . Hayashi weist darauf hin, dass diese Annahme im einfachsten autoregressiven Modell verletzt wird . [1] Betrachten Sie den AR (1) -Prozess:E[ϵixj]=0 ϵi xj
Wir können sehen , dass ein Regressor für seine y t + 1 , aber ε t ist nicht orthogonal zum y t (dh E [ ε t y t ] ≠ 0 ).yt yt+1 ϵt yt E[ϵtyt]≠0
Da die strikte Exogenitätsannahme verletzt wird, kann keines der Argumente, die auf dieser Annahme beruhen, auf dieses einfache AR (1) -Modell angewendet werden!
Wir haben also ein hartnäckiges Problem?
Nein, das machen wir nicht! Das Schätzen von AR (1) -Modellen mit gewöhnlichen kleinsten Quadraten ist ein völlig gültiges Standardverhalten. Warum kann es noch ok sein?
Asymptotische Argumente mit großer Stichprobe erfordern keine strikte Exogenität. Eine ausreichende Annahme (die anstelle einer strengen Exogenität verwendet werden kann) ist, dass die Regressoren vorbestimmt sind , dass die Regressoren orthogonal zum Ausdruck des zeitgleichen Fehlers sind. Siehe Hayashi, Kapitel 2 für ein ausführliches Argument.
Verweise
[1] Fumio Hayashi, Econometrics (2000), p. 35
[2] ibid., P. 134
quelle
Grundlegende Regressionsmethoden vom Typ der kleinsten Quadrate setzen nicht voraus, dass die y-Werte iid sind. Sie setzen die Residuen voraus (dh y-Wert minus wahrer Trend) iid sind
Es gibt auch andere Regressionsmethoden, die andere Annahmen treffen, aber das würde diese Antwort wahrscheinlich zu kompliziert machen.
quelle
Das ist eine gute Frage! Das Problem wird in meinen Zeitreihenbüchern nicht einmal erwähnt (ich brauche wahrscheinlich bessere Bücher :). Beachten Sie zunächst, dass Sie nicht gezwungen sind, eine lineare Regression zu verwenden, um eine Zeitreihe zu zerstören. wenn die Reihe einen stochastischen Trend aufweist (Einheitswurzel) )- Sie könnten einfach den ersten Unterschied nehmen. Sie müssen jedoch die lineare Regression verwenden, wenn die Reihe einen deterministischen Trend aufweist. In diesem Fall ist es wahr, dass die Residuen nicht iid sind, wie Sie sagen. Denken Sie nur an eine Reihe mit linearem Trend, saisonalen Komponenten, zyklischen Komponenten usw. - nach linearer Regression sind die Residuen so gut wie unabhängig. Der Punkt ist, dass Sie dann keine lineare Regression verwenden, um Vorhersagen zu treffen oder Vorhersageintervalle zu bilden. Dies ist nur ein Teil Ihres Inferenzverfahrens: Sie müssen noch andere Methoden anwenden, um zu nicht korrelierten Residuen zu gelangen. Also, während lineare Regression an sich ist für die meisten Zeitreihen kein gültiges Inferenzverfahren (es ist nicht das richtige statistische Modell). Ein Verfahren, das eine lineare Regression enthält, da einer seiner Schritte ein gültiges Modell sein kann, wenn das von ihm angenommene Modell dem Datenerzeugungsprozess für das entspricht Zeitfolgen.
quelle