Bei der Methode der kleinsten Quadrate möchten wir die unbekannten Parameter im Modell schätzen:
Sobald wir dies getan haben (für einige beobachtete Werte), erhalten wir die angepasste Regressionslinie:
Jetzt wollen wir natürlich einige Diagramme überprüfen, um sicherzustellen, dass die Annahmen erfüllt sind. Angenommen, Sie möchten die Homoskedastizität überprüfen. Dazu überprüfen wir jedoch tatsächlich die Residuen . Angenommen, Sie untersuchen das Diagramm der Residuen gegen die vorhergesagten Werte. Wenn dies zeigt, dass Heteroskedastizität offensichtlich ist, wie hängt das dann mit dem Störungsterm ε j zusammen ? Bedeutet Heteroskedastizität in den Residuen eine störungsbedingte Heteroskedastizität?
Die Beziehung zwischen ε und ε ist:ε^ ε
wobei , die Hutmatrix, X ( X T X ) - 1 X T ist .H. X.( X.T.X.)- 1X.T.
Welches ist zu sagen , dass ε i eine lineare Kombination aller Fehler, aber in der Regel der meisten Gewicht fällt auf dem i - ten ein.ε^ich ich
Hier ist ein Beispiel unter Verwendung des
cars
Datensatzes in R. Betrachten Sie den lila markierten Punkt:Wir können das umschreiben als:
oder allgemeiner
Das heißt, bei gut erzogenen Regressionen können Residuen meist wie eine mäßig verrauschte Schätzung des nicht beobachtbaren Fehlerausdrucks behandelt werden. Wenn wir Punkte betrachten, die weiter vom Zentrum entfernt sind, funktionieren die Dinge etwas weniger gut (der Rest wird weniger auf den Fehler gewichtet und die Gewichte auf die anderen Fehler werden weniger gleichmäßig).
quelle