Ich habe eine Matrix mit zwei Spalten, die viele Preise haben (750). Im Bild unten habe ich die Residuen der folgenden linearen Regression aufgetragen:
lm(prices[,1] ~ prices[,2])
Betrachtet man das Bild, scheint dies eine sehr starke Autokorrelation der Residuen zu sein.
Wie kann ich jedoch testen, ob die Autokorrelation dieser Residuen stark ist? Welche Methode soll ich anwenden?
Vielen Dank!
acf()
) betrachten, aber dies wird einfach bestätigen, was für ein einfaches Auge sichtbar ist: Die Korrelationen zwischen verzögerten Residuen sind sehr hoch.qt(0.75, numberofobs)/sqrt(numberofobs)
Antworten:
Es gibt wahrscheinlich viele Möglichkeiten, dies zu tun, aber die erste, die mir in den Sinn kommt, basiert auf linearer Regression. Sie können die aufeinanderfolgenden Residuen gegeneinander regressieren und auf eine signifikante Steigung testen. Wenn es eine Autokorrelation gibt, sollte es eine lineare Beziehung zwischen aufeinanderfolgenden Residuen geben. Um den Code zu vervollständigen, den Sie geschrieben haben, können Sie Folgendes tun:
mod2 ist eine lineare Regression der Zeit error, & epsi ; t , gegen die Zeit t - 1 error, & epsi ; t - 1 . Wenn der Koeffizient für res [-1] signifikant ist, haben Sie Hinweise auf eine Autokorrelation in den Residuen.t εt t - 1 εt - 1
Hinweis: Dies setzt implizit voraus, dass die Residuen in dem Sinne autoregressiv sind, dass nur für die Vorhersage von ε t wichtig ist . In der Realität kann es zu Abhängigkeiten mit größerer Reichweite kommen. In diesem Fall sollte diese von mir beschriebene Methode als die autoregressive Näherung mit einer Verzögerung an die wahre Autokorrelationsstruktur in ε interpretiert werden .εt - 1 εt ε
quelle
Verwenden Sie den im lmtest- Paket implementierten Durbin-Watson-Test .
quelle
Der DW-Test oder der lineare Regressionstest sind nicht robust gegenüber Anomalien in den Daten. Wenn Sie Impulse, saisonale Impulse, Pegelverschiebungen oder lokale Zeittrends haben, sind diese Tests unbrauchbar, da diese unbehandelten Komponenten die Varianz der Fehler aufblähen und so die Tests nach unten drängen, was Sie (wie Sie herausgefunden haben) dazu veranlasst, die Nullhypothese von Nr Autokorrelation. Bevor diese beiden Tests oder ein anderer parametrischer Test, von dem ich weiß, dass er verwendet werden kann, muss "nachgewiesen" werden, dass der Mittelwert der Residuen statistisch nicht signifikant von 0,0 abweicht, ansonsten sind die zugrunde liegenden Annahmen ungültig. Es ist bekannt, dass eine der Einschränkungen des DW-Tests die Annahme ist, dass die Regressionsfehler normalverteilt sind. Beachten Sie normalverteilte Mittel unter anderem: Keine Anomalien (vglhttp://homepage.newschool.edu/~canjels/permdw12.pdf ). Darüber hinaus wird beim DW-Test nur die Autokorrelation von Verzögerung 1 geprüft. Ihre Daten haben möglicherweise einen wöchentlichen / saisonalen Effekt, und dies würde nicht diagnostiziert und außerdem den DW-Test unbehandelt nach unten verzerren.
quelle