Anpassung der multiplen linearen Regression in R: autokorrelierte Residuen

11

Ich versuche, eine multiple lineare Regression in R mit einer Gleichung wie der folgenden zu schätzen:

regr <- lm(rate ~ constant + askings + questions + 0)

Fragen und Antworten sind vierteljährliche Datenzeitreihen, die mit erstellt wurden askings <- ts(...).

Das Problem ist jetzt, dass ich autokorrelierte Residuen habe. Ich weiß, dass es möglich ist, die Regression mit der gls-Funktion anzupassen, aber ich weiß nicht, wie ich die richtige AR- oder ARMA-Fehlerstruktur identifizieren kann, die ich in die gls-Funktion implementieren muss.

Ich würde jetzt nochmal versuchen zu schätzen mit,

gls(rate ~ constant + askings + questions + 0, correlation=corARMA(p=?,q=?))

aber ich bin leider weder ein R-Experte noch ein statistischer Experte im Allgemeinen, um p und q zu identifizieren.

Ich würde mich freuen, wenn mir jemand einen nützlichen Hinweis geben könnte. Vielen Dank im Voraus!

Jo

Jo Schuster
quelle

Antworten:

8

Versuchen

library(forecast)
fit <- auto.arima(rate, xreg=cbind(askings,questions))

Das passt zum linearen Modell und identifiziert automatisch eine ARMA-Struktur für die Fehler. Es wird MLE anstelle von GLS verwendet, diese sind jedoch asymptotisch äquivalent.

Rob Hyndman
quelle
Das ist so hilfreich.
Olga Mu
3

Wenn Sie eine Vorhersage treffen möchten, können Sie eine Reihe von Modellen über Parameter hinweg anpassen:

expand.grid(p = 1:P, q = 1:Q)

wo Pund Qsind die maximalen AR (p) - und MA (q) -Terme, die Sie einschließen möchten, und wählen Sie das am besten passende Modell, wie von BIC bestimmt.

auto.arima()in package forecast wird dabei helfen, aber es kann einfach per Hand mit expand.grid()and loop und der arima()Funktion, die mit R geliefert wird, codiert werden .

Das Obige passt auf die Residuen von a gls()ohne correlationStruktur.

Sie können das Ganze auch direkt von Hand machen, gls()indem Sie einfach viele Modelle für Kombinationen von pund qund die eingebaute AIC()Funktion anbringen.

Sie können auch die ACF ( acf()) und die partielle ACF ( pacf()) der Residuen aus einem linearen Modell ohne Korrelationsstruktur zeichnen und sie verwenden, um die Reihenfolge des erforderlichen Modells vorzuschlagen.

Setzen Sie Monica - G. Simpson wieder ein
quelle