Wie funktioniert der Standardfehler?

17

Ich habe mich in letzter Zeit mit der Funktionsweise des Standardfehlers befasst und war nicht in der Lage zu verstehen, wie er funktioniert. Mein Verständnis des Standardfehlers ist, dass es sich um die Standardabweichung der Verteilung der Stichprobenmittel handelt. Meine Fragen sind:

• Woher wissen wir, dass der Standardfehler die Standardabweichung der Stichprobe ist, wenn wir normalerweise nur eine einzige Stichprobe entnehmen?

• Warum spiegelt die Gleichung zur Berechnung des Standardfehlers nicht die Standardabweichungsgleichung für eine einzelne Stichprobe wider?

standard-error Luciano
quelle

Wenn Sie "Einzelstichprobe" sagen, meinen Sie eine Stichprobe oder wirklich eine Stichprobengröße von 1?

Erik

1

Diese werden für ein einfaches, aber interessantes Problem (eine ternäre Antwort) in einfacher, nicht statistischer Sprache unter stats.stackexchange.com/a/18609 erläutert .

whuber

13

Ja, der Standardfehler des Mittelwerts (SEM) ist die Standardabweichung (SD) des Mittelwerts. (Standardfehler ist eine andere Möglichkeit, SD einer Stichprobenverteilung auszudrücken. In diesem Fall ist die Stichprobenverteilung ein Mittel für Stichproben fester Größe, beispielsweise N.) Zwischen dem SEM und der Grundgesamtheit besteht eine mathematische Beziehung SD: SEM = Grundgesamtheit SD / Quadratwurzel von N. Diese mathematische Beziehung ist sehr hilfreich, da wir fast nie eine direkte Schätzung des SEM haben, aber eine Schätzung der Populations-SD (nämlich der SD unserer Stichprobe). Zu Ihrer zweiten Frage: Wenn Sie mehrere Stichproben der Größe N sammeln und den Mittelwert für jede Stichprobe berechnen, können Sie das SEM einfach durch Berechnung der SD der Mittelwerte abschätzen. Die Formel für REM spiegelt also tatsächlich die Formel für die SD einer einzelnen Stichprobe wider.

Joel W.
quelle

13

Angenommen, sind unabhängig und identisch verteilt. Ich bin mir ziemlich sicher, dass Sie sich auf diese Situation beziehen. Sei ihr gemeinsamer Mittelwert und ihre gemeinsame Varianz . $X_1, X_2, \ldots, X_n$ $\mu$ $\sigma^2$

Jetzt ist der Stichprobenmittelwert . Die Linearität der Erwartung zeigt, dass der Mittelwert von auch . Die Unabhängigkeitsannahme impliziert, dass die Varianz von die Summe der Varianzen seiner Terme ist. Jeder solche Term hat die Varianz (weil die Varianz einer Konstanten mal einer Zufallsvariablen das Quadrat mal der Varianz der Zufallsvariablen ist). Wir haben solche Variablen identisch verteilt, um zu summieren, also hat jeder Term die gleiche Varianz. Als Ergebnis erhalten wir für die Varianz des Stichprobenmittelwerts. $X_b=\sum_i X_i/n$ $X_b$ $\mu$ $X_b$ $X_i/n$ $\sigma^2/n^2$ $n$ $n \sigma^2/n^2 = \sigma^2/n$

Normalerweise kennen wir und müssen es daher aus den Daten abschätzen. Je nach Einstellung gibt es verschiedene Möglichkeiten, dies zu tun. Die beiden häufigsten Allzweckschätzungen von sind die Stichprobenvarianz und ein kleines Vielfaches davon, (ein unverzerrter Schätzer von ). Wenn Sie eine dieser anstelle von im vorhergehenden Absatz verwenden und die Quadratwurzel ziehen, erhalten Sie den Standardfehler in Form von oder . $\sigma^2$ $\sigma^2$ $s^2 = \frac{1}{n}\sum_i(X_i-X_b)^2$ $s_u^2 = \frac{n}{n-1}s^2$ $\sigma^2$ $\sigma^2$ $s/\sqrt{n}$ $s_u/\sqrt{n}$

Michael R. Chernick
quelle

1

Das ist sehr gut. Haben Sie Vorschläge für Bücher oder Lesungen, um ähnliche Denkfähigkeiten zu entwickeln? Vielen Dank.

q126y

Elegante Antwort!

Jinhua Wang

7

+1 an beide @JoelW. & @MichaelChernick. Ich möchte der Antwort von @ JoelW. Ein Detail hinzufügen. Er stellt fest, dass "wir fast nie eine direkte Schätzung des SEM haben", was im Wesentlichen wahr ist, aber es lohnt sich, eine Einschränkung dieser Aussage ausdrücklich anzuerkennen. Insbesondere wenn eine Studie mehrere Gruppen / Behandlungen vergleicht (z. B. Placebo vs. Standardmedikament vs. neues Medikament), wird in der Regel eine ANOVA verwendet, um festzustellen, ob alle gleich sind. Die Nullhypothese ist, dass jede Gruppe aus derselben Population gezogen wurde und daher alle drei Mittelwerte Schätzungen des Bevölkerungsmittelwerts sind. Das heißt, nimmt die Nullhypothese in einem Standard - ANOVA , dass Sie zu tun haben eine direkte Schätzung des SEM. Betrachten Sie die Gleichung für die Varianz der Stichprobenverteilung der Mittelwerte:

σ_{\bar{x}}^{2} = \frac{σ_{p Ö p}^{2}}{n_{j}},

$\sigma^2_{\bar x}=\frac{\sigma^2_{pop}}{n_j},$ Dabei ist die Populationsvarianz und die Anzahl der Gruppen. Obwohl wir die Berechnungen normalerweise nicht auf diese Weise durchführen, könnten wir einfach Standardformeln verwenden, um geschätzte Werte einzufügen, und mit minimaler algebraischer Umbildung die Statistik wie folgt bilden : In diesem Fall würden wir wirklich die Standardformel verwenden (nur angewendet über die Gruppenmittel), das heißt: mitder Mittelwert der Gruppe zu sein bedeutet.

σ_{p o p}^{2}

$\sigma^2_{pop}$

n_{j}

$n_j$

F

$F$

F = \frac{n_{j} \times s_{\bar{x}}^{2}}{s_{innerhalb der Gruppe zusammengefasst}^{2}}

$F=\frac{n_j\times s^2_{\bar x}}{s^2_{\text{pooled within group}}}$

s_{\bar{x}}^{2} = \frac{\sum_{j = 1}^{n_{j}} ({\bar{x}}_{j} - {\bar{x}}_{.})^{2}}{n_{j} - 1},

$s^2_{\bar x}=\frac{\sum_{j=1}^{n_j}(\bar x_j-\bar x_.)^2}{n_j-1},$

x_{.}

$x_.$

Insofern glauben wir in der Regel, dass die Nullhypothese nicht zutrifft. Der Punkt von @ JoelW. Ist richtig, aber ich arbeite diesen Punkt durch, weil ich denke, dass die Klarheit, die er bietet, für das Verständnis dieser Probleme hilfreich ist.

gung - Wiedereinsetzung von Monica
quelle

2

Ich denke, Ihr Kommentar ist im Grunde derselbe wie dieser, der mit weniger mathematischer Notation geschrieben wurde: stats.stackexchange.com/questions/32206/…

Joel W.

Wie funktioniert der Standardfehler?

Antworten: