Ich betrachte einige Probleme und in einigen, um die Koeffizienten zu testen, sehe ich manchmal Leute, die die Schülerverteilung verwenden, und manchmal sehe ich die Normalverteilung. Was ist die Regel?
10
Ich betrachte einige Probleme und in einigen, um die Koeffizienten zu testen, sehe ich manchmal Leute, die die Schülerverteilung verwenden, und manchmal sehe ich die Normalverteilung. Was ist die Regel?
Antworten:
Die Normalverteilung ist die große Stichprobenverteilung bei vielen bedeutsamen statistischen Problemen, die eine Version des zentralen Grenzwertsatzes betreffen: Sie haben (ungefähr) unabhängige Informationen, die addiert werden, um zur Antwort zu gelangen. Wenn Parameterschätzungen asymptotisch normal sind, sind ihre Funktionen auch asymptotisch normal (in regulären Fällen).
Andererseits wird die Student Verteilung unter restriktiveren Bedingungen für normale Regressionsfehler abgeleitet. Wenn Sie diese Annahme kaufen können, können Sie die Verteilung kaufen , die zum Testen der Hypothese in der linearen Regression verwendet wird. Die Verwendung dieser Verteilung bietet breitere Konfidenzintervalle als die Verwendung der Normalverteilung. Die wesentliche Bedeutung davon ist, dass Sie in kleinen Stichproben Ihr Maß für die Unsicherheit, den mittleren quadratischen Regressionsfehler oder die Standardabweichung der Residuen schätzen müssen . (In großen Stichproben haben Sie so viele Informationen, als ob Sie es wüssten, sodass die Verteilung zur Normalverteilung degeneriert.)t σ tt t σ t
Es gibt einige Fälle in der linearen Regression, selbst bei endlichen Stichproben, in denen die Student-Verteilung nicht gerechtfertigt werden kann. Sie beziehen sich auf Verstöße gegen die Bedingungen zweiter Ordnung in Bezug auf Regressionsfehler. nämlich, dass sie (1) konstante Varianz und (2) unabhängig sind. Wenn diese Annahmen verletzt werden und Sie Ihre Standardfehler mit dem Eicker / White-Schätzer für heteroskedastische, aber unabhängige Residuen korrigieren ; oder Newey-West- Schätzer für seriell korrelierte Fehler oder gruppierte StandardfehlerFür clusterkorrelierte Daten gibt es keine Möglichkeit, eine vernünftige Begründung für die Verteilung von Schülern zu finden. Wenn Sie jedoch eine geeignete Version des asymptotischen Normalitätsarguments (Traingular-Arrays usw.) verwenden, können Sie die normale Annäherung rechtfertigen (obwohl Sie bedenken sollten, dass Ihre Konfidenzintervalle sehr wahrscheinlich zu eng wären).
quelle
Ich mag die Darstellung der Schülerverteilung als Mischung aus einer Normalverteilung und einer Gammaverteilung:
Es ist zu beachten, dass der Mittelwert der Gammaverteilung und die Varianz dieser Verteilung . Wir können also die t-Verteilung als Verallgemeinerung der Annahme einer konstanten Varianz auf eine "ähnliche" Varianzannahme betrachten. steuert grundsätzlich, wie ähnlich wir die Abweichungen zulassen. Sie sehen dies auch als "zufällig gewichtete" Regression an, da wir das obige Integral wie folgt als "versteckte Variable" darstellen können:E[ρ|ν]=1 V[ρ|ν]=2ν ν
Wobei und alle Variablen unabhängig sind. Tatsächlich ist dies im Grunde nur die Definition der t-Verteilung alsei∼N(0,σ2) ρi∼Gamma(ν2,ν2) Gamma(ν2,ν2)∼1νχ2ν
Sie können sehen, warum dieses Ergebnis die Schüler-t-Verteilung im Vergleich zur Normalverteilung "robust" macht, da ein großer Fehler aufgrund eines großen Werts von oder aufgrund eines kleinen Werts von . Da nun allen Beobachtungen gemeinsam ist, aber spezifisch für die i-te ist, ist der allgemeine " Menschenverstand" zu schließen, dass Ausreißer Beweise für kleine . Wenn Sie eine lineare Regression , werden Sie außerdem feststellen, dass das Gewicht für die i-te Beobachtung ist, vorausgesetzt, ist bekannt:yi−μi σ2 ρi σ2 ρi ρi μi=xTiβ ρi ρi
Ein Ausreißer ist also ein Beweis für ein kleines was bedeutet, dass die i-te Beobachtung weniger Gewicht erhält. Zusätzlich ist ein kleiner "Ausreißer" - eine Beobachtung, die viel besser vorhergesagt / angepasst wird als der Rest - ein Beweis für große . Daher wird dieser Beobachtung in der Regression mehr Gewicht beigemessen. Dies entspricht dem, was man intuitiv mit einem Ausreißer oder einem guten Datenpunkt machen würde.ρ iρi ρi
Beachten Sie, dass es keine "Regel" für die Entscheidung dieser Dinge gibt, obwohl meine und andere Antworten auf diese Frage nützlich sein können, um einige Tests zu finden, die Sie entlang des endlichen Varianzpfads durchführen können (Student t ist eine unendliche Varianz für Freiheitsgrade kleiner oder gleich) bis zwei).
quelle