Warum jemals Durbin-Watson verwenden, anstatt die Autokorrelation zu testen?

10

Der Durbin-Watson-Test testet die Autokorrelation von Residuen bei Verzögerung 1. Aber auch das Testen der Autokorrelation bei Verzögerung 1 direkt. Außerdem können Sie die Autokorrelation bei Verzögerung 2,3,4 testen, und es gibt gute Portmanteau-Tests für die Autokorrelation bei mehreren Verzögerungen, um schöne, leicht interpretierbare Diagramme zu erhalten [z. B. die Funktion acf () in R]. Durbin-Watson ist nicht intuitiv zu verstehen und führt oft zu nicht schlüssigen Ergebnissen. Warum also jemals benutzen?

Dies wurde durch diese Frage zur Unschlüssigkeit einiger Durbin-Watson-Tests inspiriert , ist aber deutlich davon getrennt.

Radfahrer
quelle
1
Sie können tatsächlich Durbin-Watson für andere Verzögerungen tun. Suchen Sie nach allgemeinen Durbin-Watson-Statistiken.
Brandon Sherman

Antworten:

8

Wie bereits in diesem und anderen Themen erwähnt: (1) Der Durbin-Watson-Test ist nicht nicht schlüssig. Nur die ursprünglich von Durbin und Watson vorgeschlagenen Grenzen waren, weil die genaue Verteilung von der beobachteten Regressormatrix abhängt. Dies ist jedoch in der statistischen / ökonometrischen Software inzwischen leicht zu beheben. (2) Es gibt Verallgemeinerungen des Durbin-Watson-Tests auf höhere Verzögerungen. Daher ist weder Unschlüssigkeit noch Begrenzung von Verzögerungen ein Argument gegen den Durbin-Watson-Test.

Im Vergleich zum Wald-Test der verzögerten abhängigen Variablen kann der Durbin-Watson-Test in bestimmten Modellen eine höhere Leistung aufweisen. Insbesondere wenn das Modell deterministische Trends oder saisonale Muster enthält, kann es besser sein, die Autokorrelation in den Residuen zu testen (wie dies beim Durbin-Watson-Test der Fall ist), als die verzögerte Antwort einzubeziehen (die noch nicht an die deterministischen Muster angepasst ist). . Ich füge unten eine kleine R-Simulation hinzu.

Ein wichtiger Nachteil des Durbin-Watson-Tests besteht darin, dass er nicht auf Modelle angewendet werden darf, die bereits autoregressive Effekte enthalten. Daher können Sie die verbleibende verbleibende Autokorrelation nicht testen, nachdem Sie sie teilweise in einem autoregressiven Modell erfasst haben. In diesem Szenario kann die Leistung des Durbin-Watson-Tests vollständig ausfallen, während dies beim Breusch-Godfrey-Test beispielsweise nicht der Fall ist. Unser Buch "Angewandte Ökonometrie mit R" enthält eine kleine Simulationsstudie, die dies im Kapitel "Programmieren Ihrer eigenen Analyse" unter http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ zeigt .

Für einen Datensatz mit Trend plus autokorrelierten Fehlern ist die Leistung des Durbin-Watson-Tests jedoch höher als für den Breusch-Godfrey-Test und auch höher als für den Wald-Test der autoregressiven Wirkung. Ich illustriere dies für ein einfaches kleines Szenario in R. Ich zeichne 50 Beobachtungen aus einem solchen Modell und berechne p-Werte für alle drei Tests:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

Dann können wir 1000 p-Werte für alle drei Modelle simulieren:

set.seed(1)
p <- t(replicate(1000, pvals()))

Der Durbin-Watson-Test führt zu den niedrigsten durchschnittlichen p-Werten

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

und die höchste Leistung bei 5% Signifikanzniveau:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 
Achim Zeileis
quelle
Eine weitere Einschränkung der DW-Statistik besteht darin, dass sie nicht verwendet werden kann, wenn das Modell bereits versucht, die Autokorrelation zu steuern. Ich schätze die Tatsache, dass die DW mehr Leistung hat als Wald oder Breusch-Godfrey (von denen ich keine verwendet habe), aber mein üblicher Vergleich ist mit einem Portmanteau-Test wie Ljung-Box und den einzelnen Autokorrelationen im Vergleich zu einer Null von 0. Das ist ein typisches Regime bei der Vorhersage von Lehrbüchern.
Radfahrer
2
Es ist nicht wirklich eine weitere Einschränkung IMO, sondern die Haupteinschränkung . Die anderen Probleme (Berechnung von p-Werten anstelle von Grenzen und Anzahl von Verzögerungen) können behandelt werden. Und seien Sie vorsichtig mit der Potenzinterpretation: Ich sagte, dass in diesem speziellen Modell - deterministischer Trend mit AR (1) -Fehlerterm - der Durbin-Watson-Test eine höhere Leistung hat. Dies ist bei vielen anderen Setups möglicherweise nicht der Fall. Und was den Ljung-Box-Test betrifft: Ja, dies ist der klassische Test, um die verbleibende Autokorrelation nach dem Einbau eines ARIMA-Modells zu überprüfen.
Achim Zeileis
3

Mit dem Durbin-Watson-Test testen Sie die Autokorrelation. Das Zeichnen eines ACF ist wie das Erstellen eines QQ-Diagramms, um die Normalität zu testen. Es ist nützlich, einen QQ-Plot zu betrachten, um die Normalität zu testen, aber ein Kolmogorov-Smirnov- oder Levene-Test ergänzt das, was Sie im Plot sehen, da ein Hypothesentest für die Normalität aussagekräftiger ist.

In Bezug auf mehrere Verzögerungen können Sie eine verallgemeinerte Durbin-Watson-Statistik verwenden, einige Hypothesentests durchführen und eine Bonferroni-Korrektur durchführen, um mehrere Tests zu korrigieren. Sie können auch einen Breusch-Godfrey-Test durchführen, bei dem das Vorhandensein einer Korrelation beliebiger Reihenfolge überprüft wird.

Brandon Sherman
quelle