Warum sagen wir "Reststandardfehler"?

14

Ein Standardfehler ist die geschätzte Standardabweichung σ ( θ ) eines Schätzers θ für einen Parameter θ .σ^(θ^)θ^θ

Warum heißt die geschätzte Standardabweichung der Residuen "Reststandardfehler" (z. B. in der Ausgabe der R- summary.lmFunktion) und nicht "Reststandardabweichung"? Welche Parameterschätzung statten wir hier mit einem Standardfehler aus?

Betrachten wir jedes Residuum als Schätzer für "seinen" Fehlerausdruck und schätzen den "gepoolten" Standardfehler aller dieser Schätzer?

Michael M
quelle
6
Ich denke, das ist eine R-Sache. Ich glaube nicht, dass andere Software diese Phrasierung zwangsläufig verwendet. & 'Reststandardabweichung' ist in Lehrbüchern üblich, z. Ich habe keine Antwort, aber ich fand es immer komisch, dass R diesen Ausdruck verwendet.
gung - Wiedereinsetzung von Monica
@gung: das könnte die erklärung sein! Wenn ich "Reststandardfehler" in Anführungszeichen google, erhalte ich nur 0,1% der Treffer als ohne Anführungszeichen ...
Michael M
Ich könnte das als (Nicht-) Antwort formulieren, wenn Sie es vorziehen.
gung - Wiedereinsetzung von Monica
1
@gung Es ist lustig, wie die Verwendung bestimmter Software Ihr Denken beeinflusst: Ich würde es nie "Residuum SD" nennen - Residuen sind keine Daten, sondern Fehler, daher scheint Residuum Error der richtige Name zu sein. Aber wenn Sie darüber nachdenken, scheint es wirklich ein R-Ding zu sein.
Tim
2
@Tim, es könnte korrekterweise als Schätzung der Standardabweichung der Fehler angesehen werden , aber die Residuen sind technisch nicht die Fehler selbst. Es ist auch nicht der Standardfehler des Fehlers SD, für das, was das wert ist.
gung - Reinstate Monica

Antworten:

12

Ich denke, dass die Phrasierung spezifisch für die summary.lm()Ausgabe von R ist . Beachten Sie, dass der zugrunde liegende Wert tatsächlich "Sigma" ( summary.lm()$sigma) heißt. Ich glaube nicht, dass andere Software diesen Namen unbedingt für die Standardabweichung der Residuen verwendet. Darüber hinaus ist die Formulierung "Reststandardabweichung" beispielsweise in Lehrbüchern üblich. Ich weiß nicht, wie das zu der Phrasierung in Rs summary.lm()Ausgabe kam, aber ich fand es immer komisch.

gung - Wiedereinsetzung von Monica
quelle
Wie summary.lm(reg)$sigmaunterscheidet sich von sd(reg$residuals)?
Luftangriff
3
@ AndréTerra, die richtigen Freiheitsgrade sind n - p, was die Zusammenfassung verwendet. sd benutzt var mit n - 1 Freiheitsgraden. Wenn Sie die Standardabweichung der durch n - p dividierten Residuen manuell berechnen, erhalten Sie dieselbe Antwort wie in der Zusammenfassung angegeben.
Jdub
3
Um Gung zu bestätigen, zitiere ich aus der R-Dokumentation von stats::sigma: Die Fehlbezeichnung „Residual Standard Error“ war Teil zu vieler R- (und S-) Ausgaben, um dort leicht geändert zu werden.
NRH
2

In meiner ökonometrischen Ausbildung wird es als "Reststandardfehler" bezeichnet, da es sich um eine Schätzung der tatsächlichen "Reststandardabweichung" handelt. Siehe diese verwandte Frage , die diese Terminologie bestätigt.

Eine Google-Suche nach dem Begriff "Reststandardfehler" zeigt ebenfalls viele Treffer und ist daher keineswegs eine Seltsamkeit. Ich habe beide Begriffe mit Anführungszeichen ausprobiert und beide tauchen ungefähr 60.000 Mal auf.

Heisenberg
quelle
Interessant. Aber warum würden Sie eine Schätzung einer Standardabweichung einer beliebigen Zufallsvariablen (wie ein Fehlerterm und kein bestimmter Schätzer) als "Standardfehler" bezeichnen?
Michael M
Meiner Meinung nach müssen wir einen Namen für die Schätzung haben (um vom tatsächlichen Wert zu unterscheiden), jeder Name ist so gut wie ein anderer. Aber sicherlich kann jemand, der sich mit der Etymologie besser auskennt, einen besseren Grund bieten. Es ist zu beachten, dass es definitiv eine Parallele zum Koeffizientenstandardfehler gibt, bei dem es sich um die Schätzung der Standardabweichung des Koeffizientenschätzers handelt.
Heisenberg,
0

Einfach ausgedrückt ist der Standardfehler der Stichprobe eine Schätzung, inwieweit der Stichprobenmittelwert wahrscheinlich vom Bevölkerungsmittelwert abweicht, wohingegen die Standardabweichung der Stichprobe das Ausmaß angibt, in dem sich Personen innerhalb der Stichprobe vom Stichprobenmittelwert unterscheiden.

Standardfehler - Wikipedia, die freie Enzyklopädie

user629019
quelle
6
Dies ist wahr, aber es beantwortet die Frage nicht wirklich. Was R den "Reststandardfehler" nennt, ist nicht "eine Schätzung, wie weit der Stichprobenmittelwert wahrscheinlich vom Populationsmittelwert entfernt ist".
gung - Wiedereinsetzung von Monica
0

Ein angepasstes Regressionsmodell verwendet die Parameter, um Punktschätzungsvorhersagen zu generieren, die als Mittel für beobachtete Antworten dienen, wenn Sie die Studie unendlich oft mit denselben XX-Werten replizieren ( wenn das lineare Modell wahr ist) ).

Die Differenz zwischen diesen vorhergesagten Werten und denjenigen, die zur Anpassung an das Modell verwendet wurden, wird als " Residuen " bezeichnet " bezeichnet, die beim Replizieren des Datenerfassungsprozesses Eigenschaften von Zufallsvariablen mit 0-Mitteln aufweisen. Die beobachteten Residuen werden dann verwendet, um anschließend die Variabilität dieser Werte abzuschätzen und die Stichprobenverteilung der Parameter abzuschätzen.

Hinweis:

Wenn der verbleibende Standardfehler genau 0 ist, passt das Modell perfekt zu den Daten (wahrscheinlich aufgrund einer Überanpassung).

Wenn der verbleibende Standardfehler nicht signifikant von der Variabilität der bedingungslosen Reaktion abweicht, gibt es kaum Anhaltspunkte dafür, dass das lineare Modell Vorhersagemöglichkeiten aufweist.

Abhishek Jaiswal
quelle