Wenn in Standard-OLS-Regressionen zwei Annahmen verletzt werden (Normalverteilung von Fehlern, Homoskedastizität), sind Bootstrapping-Standardfehler und Konfidenzintervalle eine geeignete Alternative, um zu aussagekräftigen Ergebnissen hinsichtlich der Signifikanz von Regressorkoeffizienten zu gelangen?
Funktionieren Signifikanztests mit Bootstrap-Standardfehlern und Konfidenzintervallen immer noch mit Heteroskedastizität?
Wenn ja, welche Konfidenzintervalle können in diesem Szenario verwendet werden (Perzentil, BC, BCA)?
Wenn Bootstrapping in diesem Szenario angemessen ist, welche einschlägige Literatur muss gelesen und zitiert werden, um zu dieser Schlussfolgerung zu gelangen? Jeder Hinweis wäre sehr dankbar!
Antworten:
Es gibt mindestens drei (möglicherweise mehrere) Ansätze, um den Bootstrap für die lineare Regression mit unabhängigen, aber nicht identisch verteilten Daten durchzuführen. (Wenn Sie andere Verstöße gegen die "Standard" -Annahmen haben, z. B. aufgrund von Autokorrelationen mit Zeitreihendaten oder Clustering aufgrund von Stichprobenentwürfen, wird es noch komplizierter.)
Die ultimative Referenz ist Wu (1986) , aber Annals sind nicht genau die Bilderbuchlesung.
AKTUALISIERUNG basierend auf den Follow-up-Fragen des OP, die in den Kommentaren gestellt wurden:
Die Anzahl der Wiederholungen schien mir groß zu sein; Die einzige gute Diskussion über diesen Bootstrap-Parameter, die mir bekannt ist, ist in Efron & Tibshiranis Intro to Bootstrap-Buch .
Ich glaube, dass im Allgemeinen ähnliche Korrekturen für das Fehlen von Verteilungsannahmen mit Huber / White-Standardfehlern erzielt werden können.M ) zum Vergleich zwischen den Bootstrap- und Heteroskedastizitätskorrekturen.
quelle
reps(2500)
ist wahrscheinlich ein Overkill, zumindest für die Standardfehler; Ich denke,reps(500)
ist für die meisten praktischen Zwecke in Ordnung. Efron & Tibshiranis Intro-Bootstrap-Buch enthält einen Abschnitt über die Anzahl der Replikate. Sie haben auch ein ganzes Kapitel über Regression, so dass Sie sich vielleicht ein weiteres gutes Nachschlagewerk ansehen können.robust
Option Ihrer Regression eine sehr ähnliche Antwort erhalten .est store
beide Ergebnisse undest tab, se
sie nebeneinander zu vergleichen.