Gemäß der Regressionsanalyse anhand eines Beispiels ist das Residuum die Differenz zwischen der Antwort und dem vorhergesagten Wert. Dann wird gesagt, dass jedes Residuum eine andere Varianz aufweist, sodass standardisierte Residuen berücksichtigt werden müssen.
Die Varianz gilt jedoch für eine Gruppe von Werten. Wie kann ein einzelner Wert eine Varianz aufweisen?
regression
residuals
ccshao
quelle
quelle
Antworten:
Ich würde sagen, dass eine einzelne Zahl (wie ein Residuum), die aus einer zufälligen Ziehung aus einer Wahrscheinlichkeitsverteilung resultiert, ein realisierter Wert ist , keine Zufallsvariable . Ebenso würde ich sagen, dass die Menge von Residuen, berechnet aus Ihren Daten und Ihrer Modellanpassung unter Verwendung von , eine Menge von realisierten Werten ist. Dieser Satz von Zahlen kann lose als unabhängige Ziehungen aus einer zugrunde liegenden Verteilung ~ . (Leider gibt es hier jedoch einige zusätzliche Komplexitäten. Beispielsweise haben Sie tatsächlich keine = y - y ε N ( μ , σ 2 ) N e Σ e i = 0 Σ x i e i = 0N e=y−y^ ϵ N(μ,σ2) N unabhängige Informationen, da die Residuen zwei Bedingungen erfüllen müssen: und ) e ∑ei=0 ∑xiei=0
Nun, angesichts einiger Zahlen, seien es Residuen oder was auch immer, ist es sicher wahr, dass sie eine Varianz haben, , aber das ist uninteressant. Uns geht es darum, etwas über den Datengenerierungsprozess sagen zu können (zum Beispiel um die Varianz der Bevölkerungsverteilung abzuschätzen). Unter Verwendung der vorhergehenden Formel könnten wir eine Annäherung geben, indem wir das durch die verbleibenden Freiheitsgrade ersetzen , aber dies ist möglicherweise keine gute Annäherung. Dies ist ein Thema, das sehr schnell sehr kompliziert werden kann, aber einige mögliche Gründe könnten Heteroskedastizität sein (dh, dass die Varianz der Population auf verschiedenen Ebenen unterschiedlich ist ) und das Vorhandensein von AusreißernN x∑(ei−e¯)2/N N x (dh, dass ein gegebener Rest aus einer völlig anderen Population stammt). In der Praxis werden Sie mit ziemlicher Sicherheit nicht in der Lage sein, die Varianz der Population abzuschätzen, aus der ein Ausreißer gezogen wurde, aber theoretisch weist sie dennoch eine Varianz auf. Ich vermute, dass die Autoren etwas in diese Richtung gedacht haben, aber ich sollte beachten, dass ich dieses Buch nicht gelesen habe.
Update: Beim erneuten Lesen der Frage vermute ich, dass sich das Zitat möglicherweise auf die Art und Weise bezieht, wie der Wert eines Punkts die angepasste Regressionslinie und damit auf den Wert des mit diesem Punkt verbundenen Residuums beeinflusst. Die Schlüsselidee, die hier zu erfassen ist, ist die Hebelwirkung . Ich diskutiere diese Themen in meiner Antwort hier: Interpretieren von plot.lm () .x
quelle