Die Varianz des Stichprobenanteils nimmt mit n ab, aber die Anzahl nimmt mit n zu

9

Ich habe einen intuitiven Block damit. Für ein Binomialproblem beträgt die Standardabweichung einer Zählung . Umgekehrt nimmt die Standardabweichung des Stichprobenanteils mit zunehmendem und beträgt . Ich kann die Division durch , habe aber kein Gefühl dafür, warum sich Standardabweichungen in entgegengesetzte Richtungen bewegen. $\sqrt{np(1-p)}$ $n$ $\sqrt{\frac{p(1-p)}{n}}$ $n$

binomial standard-deviation user39707
quelle

1

Zwei Dinge: (a) Anteil =

\frac{1}{n}

$\frac{1}{n}$ .count

$\,\,$ und (b)

sd (c X) = c . sd (X)

$\text{sd}(cX) = c.\text{sd}(X)$ . Klar

c = \frac{1}{n}

$c = \frac{1}{n}$ hier und

\frac{1}{n} \sqrt{n} = \frac{1}{\sqrt{n}}

$\frac{1}{n}\sqrt n = \frac{1}{\sqrt n}$ .

Glen_b -Reinstate Monica

1

Ja, das ist das Problem - ich kann die Mathematik sehen und die Division durch n durchführen, aber es ist der intuitive Aspekt, der seltsam ist. Wenn Sie gefragt werden, wie Sie eine genauere Schätzung für einen Parameter erhalten, würde ich sagen, nehmen Sie eine größere Stichprobe. Dies gibt mir eine bessere Schätzung für den Anteil (OK), aber eine größere Streuung der Zählungen und je mehr Zählungen ich hinzufüge, desto schwächer ist die Schlussfolgerung, die ich ziehen kann.

Benutzer39707

Für welche Bevölkerungszahl berechnen Sie eine Standardabweichung / ein Standardintervall, wenn Sie mit Zählungen arbeiten?

Glen_b -Reinstate Monica

Ein Beispiel (Helsinki Heart Study) aus einem Buch (Moore & Mccabe) ist, wo ich nicht mehr weiterkomme. Wahrscheinlichkeit (Herzinfarkt) = 0,04 & n = 2000. Die SD für die erwartete Anzahl von Herzinfarkten beträgt 8,76. Fein. Es gab 84 Herzinfarkte in der Placebogruppe und 56 in der behandelten Gruppe. Z = 3,19 & unwahrscheinlich zufällig. Wenn 10.000 in der Studie wären, wäre die SD (Anzahl) ~ 20 und der Unterschied in 2 Gruppen nicht mehr signifikant. Aber wie können mehr Daten mich weniger diskriminieren?

Benutzer39707

1

Sind die beiden Gruppen gleich groß? Bleibt die Anzahl der Herzinfarkte gleich, wenn die Probe zunimmt?

Dimitriy V. Masterov

7

Stellen Sie sich grob vor, wir werfen eine faire Münze. Erfolg wird als Kopf definiert. Wenn wir die Münze einmal werfen , zählen Sie entweder Erfolg oder Erfolge. Beide haben eine gleiche positive Wahrscheinlichkeit geschieht . Stellen Sie sich nun vor, wir werfen die Münze Mal ( ). Jetzt können Sie immer noch und Erfolge erzielen (obwohl beide weniger wahrscheinlich sind), aber Sie können auch bis $(n=1)$ $1$ $0$ $(1/2)$ $10$ $n=10$ $0$ $1$ $2$ $10$ (die wahrscheinlicher sind). Wenn die Varianz misst, wie weit eine Reihe von Zahlen verteilt ist, können Sie bei Würfen sehen, dass die Streuung breiter ist als bei Wurf oder Versuch. Dies erklärt, warum die Varianz der Anzahl der Erfolge mit zunimmt . $10$ $1$ $n$

Mit dem Anteil (Anzahl der Erfolge geteilt durch die Anzahl der Würfe) versuchen Sie, den wahren Wert von zu approximieren . Wenn Sie mit mehr Versuchen mehr Informationen erhalten, sinkt Ihre Unsicherheit über , und die Varianz nimmt ab. Mit einem Wurf, der auf den Kopf kommt, weiß man nicht viel (nur das . Mit Würfen, die sich alle als Köpfe herausstellen, sind Sie sich ziemlich sicher, dass in der Nähe von einem ist. $p$ $p$ $p \ne 0)$ $10$ $p$

Dimitriy V. Masterov
quelle

Ich ging zurück zum Lehrbuch und sah aus, als würde ich es immer noch nicht ganz verstehen, fürchte ich. Der Kommentar, den ich oben über die Helsinki Heart-Studie gemacht habe, fasst zusammen, wo es mir

momentan

2

Beginnen wir mit der Annahme, dass die Standardabweichung der Binomialverteilung korrekt ist (es ist). Dies ist die Standardabweichung der Verteilung der Anzahl der Erfolge aus $n$ Versuchen bei konstanter Erfolgswahrscheinlichkeit $p$ . Rufen Sie die Anzahl der Erfolge, $X$ .

Also ist $Var(X) = np(1-p)$ , was Sie haben (Standardabweichung im Quadrat).

Da ein Anteil die Anzahl der Erfolge über die Anzahl der Versuche ist, haben wir:

$Var(\frac{X}{n}) = \frac{Var(X)}{n^2} = \frac{np(1-p)}{n^2} = \frac{p(1-p)}{n}$ .

Und somit ist die Standardabweichung natürlich $\sqrt{\frac{p(1-p)}{n}}$ .

In einem Fall betrachten Sie die Anzahl, in dem anderen Fall die Anzahl geteilt durch die Stichprobengröße.

Intuitiv können Sie sich vorstellen, dass die Anzahl der Erfolge viel höher ist ( $X = 0, 1, 2, \ldots, n$ ) als ein Anteil ( $0 \leq p \leq 1$ ). Wenn $n$ zunimmt, kann $X$ viele verschiedene (und größere) ganzzahlige Werte annehmen und weist eine größere Variabilität auf; $p$ ist dagegen zwischen 0 und 1 begrenzt. $X$ hat also mehr Variabilität.

Underminer
quelle

Wie bist du zu

? Warum ist der Nenner

?

V a r (\frac{X}{n}) = \frac{V a r (X)}{n^{2}}

$Var(\frac{X}{n}) = \frac{Var(X)}{n^2}$

n^{2}

$n^2$

user490895

also

V a r (X) = E (X^{2}) - [E (X)]^{2}

$Var(X)=E(X^2)-[E(X)]^2$

V a r (c X) = E (c^{2} X^{2}) - [c E (X)]^{2}

$Var(cX) = E(c^2X^2)-[cE(X)]^2$

= c^{2} E (X^{2}) - c^{2} E (X)^{2}

$=c^2E(X^2)-c^2E(X)^2$

. Hier ist

. Ich habe einen Tippfehler in der dritten Gleichheit der Antwort gemacht, die ich jetzt beheben werde.

= c^{2} (E (X^{2}) - [E (X)]^{2})

$=c^2(E(X^2)-[E(X)]^2)$

= c^{2} V a r (X)

$=c^2Var(X)$

c = 1 / n

$c = 1/n$

Underminer

0

Okay! Ich mache es sehr einfach.

Wenn Sie den Standard und die Varianz normalerweise verwenden, blicken Sie zurück, versuchen zu sehen, was los ist, und projizieren dann die Zukunft. Je mehr Sie nach hinten schauen, desto mehr Informationen erhalten Sie normalerweise. Immer mehr Versuche helfen dabei, das Geschehene einzugrenzen. und Sie drehen sich jetzt besser um den Mittelwert. Std und var drehen sich nur um den Mittelwert, damit Sie immer näher an das heranrücken, was passieren wird.

Binomial ist anders! Wir wissen bereits, was los ist, wir kennen die Wahrscheinlichkeit. Rückblick ist also nicht so nützlich, weil wir die Wahrscheinlichkeit bereits kennen. Immer mehr Versuche helfen uns nicht, immer besser zu verstehen, wie sich die Dinge um den Mittelwert drehen, sondern geben uns nur eine immer breitere Verteilung. Das Erhöhen der Versuche gibt wirklich nur mehr Raum für Varianz.

Stellen Sie sich zwei Szenarien vor: eine, bei der Sie wissen möchten, wie groß jeder in einem Raum ist. mehr Messungen = näher an der tatsächlichen durchschnittlichen Höhe im Raum, Sie sind für jede neue Messung dankbar.

Zweitens hast du eine Münze. Sie wissen bereits, was der Durchschnitt ist. Es ist 50/50. Ich meine, an diesem Punkt sind Sie fertig. Stellen wir uns also vor, Sie fangen an zu flippen. Nun, jeder neue Flip bietet nur mehr Raum für Fehler. du drehst 10 mal um und du bekommst alle 10 Köpfe, du sagst zu deinem Freund, was zum Teufel! Wo waren die Chancen dafür, das ist so dumm! Nun, wenn Sie es nur einmal umgedreht hätten, hätten Sie nur eine Chance für einige verrückte Ausreißer gehabt. Mehr Flips geben dir nicht wirklich mehr Informationen, sie geben nur mehr Raum für verrückte Ergebnisse.

0 Mathe und 0 Formeln, hoffe das hilft.

Zack Flüsse
quelle

0

Wenn Sie nach einer Intuition für dieses Ergebnis suchen, fragen Sie sich, welches der folgenden Dinge variabler ist:

... der Frauenanteil in einem Haushalt oder der Frauenanteil in einem ganzen Land?
... die Anzahl der Frauen in einem Haushalt oder die Anzahl der Frauen in einem ganzen Land?

Ben - Monica wieder einsetzen
quelle

Die Varianz des Stichprobenanteils nimmt mit n ab, aber die Anzahl nimmt mit n zu - warum?

Antworten: