Ich versuche, mein lm () -basiertes Modell zu aktualisieren, um korrekte Standardfehler und -tests zu erhalten. Ich bin wirklich verwirrt, welche VC-Matrix ich verwenden soll. Die sandwich
Paketangebote vcovHC
, vcovHAC
und NeweyWest
. Während erstere nur die Heteroskedastizität erklären, erklären die beiden letzteren sowohl die serielle Korrelation als auch die Heteroskedastizität. Die Dokumentation sagt jedoch nicht viel über den Unterschied zwischen den beiden letzteren aus (zumindest verstehe ich das nicht). Als ich mir die Funktion selbst ansah, stellte ich fest, dass NeweyWest tatsächlich vcovHAC aufruft.
Empirisch sind die Ergebnisse von coeftest(mymodel, vcov. = vcovHAC)
und coeftest(mymodel, vcov. = NeweyWest)
verrückt verrückt. Während dies vcovHAC
etwas nahe an den naiven lm-Ergebnissen liegt, werden bei Verwendung von NeweyWest alle Koeffizienten unbedeutend (Tests sogar nahe an 1).
quelle
vcovHAC
sich von unterscheidetNeweyWest
. Zusammenfassend unterscheiden sich verschiedene HAC-Methoden nur bei der Wahl der Gewichte.NeweyWest
hat seine angegebenen Gewichte,vcovHAC
ist eine allgemeine Funktion, mit der Sie Ihre eigenen Gewichte angeben können , und verwendet standardmäßig Andrews-Gewichte.Antworten:
Bei dem fraglichen "Sandwich" handelt es sich um zwei Brotstücke, die durch die erwarteten Informationen definiert sind und ein Fleisch enthalten, das durch die beobachteten Informationen definiert ist. Siehe meine Kommentare hier und hier . Für eine lineare Regression lautet die Schätzgleichung:
Die erwartete Information (Brot) ist:
Die beobachteten Informationen (Fleisch) sind:
Es ist zu beachten, dass der innere Term eine Diagonale konstanter Residuen ist, wenn die Annahme einer homoskedastischen, unabhängigen Daten erfüllt ist. Dann ist der Sandwich-Kovarianzschätzer, der durch ist, die übliche lineare Regressionskovarianzmatrix wobei die Varianz der Residuen ist. Das ist jedoch ziemlich streng. Sie erhalten eine erheblich breitere Klasse von Schätzern, indem Sie die Annahmen um die Restmatrix lockern: .A−1BA−1 σ2(XTX)−1 σ2 n×n
Der "HC0"R
vcovHC
-Schätzer ist auch dann konsistent, wenn die Daten nicht unabhängig sind. Ich werde also nicht sagen, dass wir "annehmen", dass die Residuen unabhängig sind, aber ich werde sagen, dass wir "eine funktionierende unabhängige Kovarianzstruktur" verwenden. Dann wird die Matrix durch eine Diagonale der Residuen ersetztDieser Schätzer funktioniert sehr gut, außer bei kleinen Stichproben (<40 wird oft behauptet). Die HC1-3 sind verschiedene Korrekturen für endliche Proben. HC3 ist im Allgemeinen die leistungsstärkste.
Wenn es jedoch autoregressive Effekte gibt, sind die nicht diagonalen Einträge von ungleich Null, so dass eine skalierte Kovarianzmatrix basierend auf üblicherweise verwendeten autoregressiven Strukturen erzeugt wird. Dies ist die Begründung für den "vcovHAC". Hier werden sehr flexible und allgemeine Methoden zur Abschätzung des autoregressiven Effekts erstellt: Die Details können den Rahmen Ihrer Frage sprengen. Die "fleischHAC" -Funktion ist das allgemeine Arbeitstier: Die Standardmethode ist Andrews '. Newey-West ist ein Sonderfall des allgemeinen autoregressiven Fehlerschätzers. Diese Methoden lösen eines von zwei Problemen: 1. Mit welcher Geschwindigkeit nimmt die Korrelation zwischen "benachbarten" Beobachtungen ab und 2. wie groß ist der angemessene Abstand zwischen zwei Beobachtungen? Diese Wenn Sie ausgeglichene Paneldaten haben, ist dieser Kovarianzschätzer übertrieben.T
gee
gee
Paket, das stattdessen die KovarianzstrukturAR-1
oder ähnliches angibt .Die Verwendung hängt von der Art der Datenanalyse und der wissenschaftlichen Frage ab. Ich würde nicht empfehlen, alle Typen zu montieren und den Typ auszuwählen, der am besten aussieht, da es sich um ein Problem mit mehreren Tests handelt. Wie ich bereits angedeutet habe, ist der vcovHC-Schätzer auch bei Vorhandensein eines autoregressiven Effekts konsistent, sodass Sie unter verschiedenen Umständen ein "Korrelationsmodell für die Arbeitsunabhängigkeit" verwenden und begründen können.
quelle