Beim Ausführen eines Mehrfachregressionsmodells in R ist eine der Ausgaben ein Reststandardfehler von 0,0589 bei 95.161 Freiheitsgraden. Ich weiß, dass die 95.161 Freiheitsgrade durch die Differenz zwischen der Anzahl der Beobachtungen in meiner Stichprobe und der Anzahl der Variablen in meinem Modell gegeben sind. Was ist der Reststandardfehler?
regression
standard-error
residuals
ustroetz
quelle
quelle
Antworten:
Ein angepasstes Regressionsmodell verwendet die Parameter, um Punktschätzungsvorhersagen zu generieren, die als Mittel für beobachtete Antworten dienen, wenn Sie die Studie unendlich oft mit denselben Werten replizieren (und wenn das lineare Modell wahr ist). Die Differenz zwischen diesen vorhergesagten Werten und denjenigen, die zum Anpassen des Modells verwendet wurden, werden als "Residuen" bezeichnet, die beim Replizieren des Datenerfassungsprozesses Eigenschaften von Zufallsvariablen mit dem Mittelwert 0 aufweisen.X
Die beobachteten Residuen werden dann verwendet, um anschließend die Variabilität dieser Werte abzuschätzen und die Stichprobenverteilung der Parameter abzuschätzen. Wenn der verbleibende Standardfehler genau 0 ist, passt das Modell perfekt zu den Daten (wahrscheinlich aufgrund einer Überanpassung). Wenn der verbleibende Standardfehler nicht signifikant von der Variabilität der bedingungslosen Reaktion abweicht, gibt es kaum Anhaltspunkte dafür, dass das lineare Modell Vorhersagemöglichkeiten aufweist.
quelle
Angenommen, wir haben die folgende ANOVA-Tabelle (angepasst aus dem
example(aov)
Befehl von R ):Wenn Sie die Summe der Quadrate einer Variationsquelle (Modell oder Residuen) durch ihre jeweiligen Freiheitsgrade dividieren, erhalten Sie das mittlere Quadrat. Speziell für die Residuen:
76,57 ist also das mittlere Quadrat der Residuen, dh der Betrag der Residuenvariation (nach Anwendung des Modells) für Ihre Antwortvariable.
quelle
RSE wird in "Einführung in das statistische Lernen" ziemlich deutlich erklärt.
quelle