Dies würde von der Art der Heteroskedastizität abhängen. Wenn Sie ein Vorhersageintervall wünschen, benötigen Sie normalerweise eine parametrische Spezifikation wie:
yich∼ N.( x'ichβ, σich( xich, zich) )
dh wird normalerweise mit dem Mittelwert , verteilt. und Standardabweichung , wobei die Standardabweichung eine bekannte Funktion von oder vielleicht einer anderen Menge von Variablen Auf diese Weise können Sie die Standardabweichung für jede Beobachtung schätzen .
x ' i β σ i ( x i , z i ) x i z i i t hyichx'ichβσich( xich, zich)xichzichicht h
Beispiele für mögliche Funktionen sind: (Studien über Unternehmensgewinne, ein Beispiel aus Greenes "Ökonometrischer Analyse", 7. Ausgabe CH 9), wobei ist die Beobachtung der abhängigen Variablen oder, wenn mit Zeitreihendaten gearbeitet wird, GARCH- und / oder stochastische Volatilitätsspezifikationen. x i , k i t h k t hσ2ich( xich) = σ2xich , kxich , kicht hkt h
Sie können die Schätzungen als Standardfehler für Ihre Vorhersageintervalle verwenden, wenn Sie möchten. Ich werde hier auf eine formelle Behandlung verzichten, da die Berücksichtigung von Schätzfehlern in kompliziert sein kann, aber bei einer ausreichend großen Stichprobe das Ignorieren des Schätzfehlers keine Auswirkung hat das Vorhersageintervall so viel. Kurz gesagt, es ist nicht notwendig, diese Dose Würmer hier zu öffnen. Eine detailliertere Erklärung all dieser und weiterer Beispiele finden Sie in Wooldridges Buch "Introductory Econometrics: A Modern Approach" , Kapitel 8. σ i(xi,zi)σ^ich( xich, zich)σ^ich( xich, zich)
Das Problem ist, dass Menschen, die sich auf heteroskedastische oder "robuste" Regression beziehen, sich normalerweise auf die Situation beziehen, in der die genaue Natur der Heteroskedastizität (die Funktion ) ist nicht bekannt. In diesem Fall wird ein weißer oder zweistufiger Schätzer verwendet. Diese bieten konsistente Schätzungen für jedoch nicht für , sodass Sie auf natürliche Weise keine Vorhersageintervalle schätzen können. v a r ( β ) σ i σi(xi,zi)var(β^)σiβ Ich würde argumentieren, dass Vorhersageintervalle in diesem Zusammenhang sowieso nicht sinnvoll sind. Die Idee hinter diesen Sandwich-Typ-Schätzern besteht darin, den Standardfehler der Koeffizienten konsistent zu schätzenβ^ohne die Last, genaue Vorhersageintervalle für jede einzelne Beobachtung anzubieten, wodurch die Schätzungen "robuster" werden.
Bearbeiten:
Um klar zu sein, berücksichtigt das oben Gesagte nur die Regression der kleinsten Quadrate. Andere Formen der nichtparametrischen Regression, wie beispielsweise die Quantilregression, können Mittel zum Erhalten eines Vorhersageintervalls ohne parametrische Angabe des verbleibenden Standardfehlers bieten.
Wenn die Regression Ihrer Antwort auf Ihre erklärende Variable eine gerade Linie ist und Ihre Varianz mit der erklärenden Variablen zunimmt, wird ein gewichtetes Regressionsmodell mit oder (wenn Ihre nicht konstante Varianz extremer ist) als Gewicht benötigt. Dies gewichtet Ihre Varianz mit Ihrem x-Wert, so dass eine proportionale Beziehung besteht.
Hier ist Code mit den im Modell und in der Vorhersage enthaltenen Gewichten. Beachten Sie, dass Sie die Gewichte sowohl zu Ihrem ursprünglichen als auch zu Ihrem neuen Datensatz hinzufügen müssen.
Vielen Dank an @PopcornKing für seinen ursprünglichen Code aus der Berechnung von Vorhersageintervallen aus heteroskedastischen Daten .
quelle