Die Varianz des Stichprobenanteils nimmt mit n ab, aber die Anzahl nimmt mit n zu - warum?

9

Ich habe einen intuitiven Block damit. Für ein Binomialproblem beträgt die Standardabweichung einer Zählung . Umgekehrt nimmt die Standardabweichung des Stichprobenanteils mit zunehmendem und beträgt . Ich kann die Division durch , habe aber kein Gefühl dafür, warum sich Standardabweichungen in entgegengesetzte Richtungen bewegen.np(1- -p)np(1- -p)nn

user39707
quelle
1
Zwei Dinge: (a) Anteil = 1n .countund (b) sd(cX)=c.sd(X) . Klar c=1n hier und1nn=1n .
Glen_b -Reinstate Monica
1
Ja, das ist das Problem - ich kann die Mathematik sehen und die Division durch n durchführen, aber es ist der intuitive Aspekt, der seltsam ist. Wenn Sie gefragt werden, wie Sie eine genauere Schätzung für einen Parameter erhalten, würde ich sagen, nehmen Sie eine größere Stichprobe. Dies gibt mir eine bessere Schätzung für den Anteil (OK), aber eine größere Streuung der Zählungen und je mehr Zählungen ich hinzufüge, desto schwächer ist die Schlussfolgerung, die ich ziehen kann.
Benutzer39707
Für welche Bevölkerungszahl berechnen Sie eine Standardabweichung / ein Standardintervall, wenn Sie mit Zählungen arbeiten?
Glen_b -Reinstate Monica
Ein Beispiel (Helsinki Heart Study) aus einem Buch (Moore & Mccabe) ist, wo ich nicht mehr weiterkomme. Wahrscheinlichkeit (Herzinfarkt) = 0,04 & n = 2000. Die SD für die erwartete Anzahl von Herzinfarkten beträgt 8,76. Fein. Es gab 84 Herzinfarkte in der Placebogruppe und 56 in der behandelten Gruppe. Z = 3,19 & unwahrscheinlich zufällig. Wenn 10.000 in der Studie wären, wäre die SD (Anzahl) ~ 20 und der Unterschied in 2 Gruppen nicht mehr signifikant. Aber wie können mehr Daten mich weniger diskriminieren?
Benutzer39707
1
Sind die beiden Gruppen gleich groß? Bleibt die Anzahl der Herzinfarkte gleich, wenn die Probe zunimmt?
Dimitriy V. Masterov

Antworten:

7

Stellen Sie sich grob vor, wir werfen eine faire Münze. Erfolg wird als Kopf definiert. Wenn wir die Münze einmal werfen , zählen Sie entweder 1 Erfolg oder 0 Erfolge. Beide haben eine gleiche positive Wahrscheinlichkeit geschieht ( 1 / 2 ) . Stellen Sie sich nun vor, wir werfen die Münze 10 Mal ( n = 10 ). Jetzt können Sie immer noch 0 und 1 Erfolge erzielen (obwohl beide weniger wahrscheinlich sind), aber Sie können auch 2 bis 10 erzielen(n=1)10(1/.2)10n=1001210(die wahrscheinlicher sind). Wenn die Varianz misst, wie weit eine Reihe von Zahlen verteilt ist, können Sie bei Würfen sehen, dass die Streuung breiter ist als bei 1 Wurf oder Versuch. Dies erklärt, warum die Varianz der Anzahl der Erfolge mit n zunimmt .101n

Mit dem Anteil (Anzahl der Erfolge geteilt durch die Anzahl der Würfe) versuchen Sie, den wahren Wert von zu approximieren . Wenn Sie mit mehr Versuchen mehr Informationen erhalten, sinkt Ihre Unsicherheit über p , und die Varianz nimmt ab. Mit einem Wurf, der auf den Kopf kommt, weiß man nicht viel (nur das p 0 ) . Mit 10 Würfen, die sich alle als Köpfe herausstellen, sind Sie sich ziemlich sicher, dass p in der Nähe von einem ist. ppp0)10p

Dimitriy V. Masterov
quelle
Ich ging zurück zum Lehrbuch und sah aus, als würde ich es immer noch nicht ganz verstehen, fürchte ich. Der Kommentar, den ich oben über die Helsinki Heart-Studie gemacht habe, fasst zusammen, wo es mir
momentan
2

Beginnen wir mit der Annahme, dass die Standardabweichung der Binomialverteilung korrekt ist (es ist). Dies ist die Standardabweichung der Verteilung der Anzahl der Erfolge aus n Versuchen bei konstanter Erfolgswahrscheinlichkeit p . Rufen Sie die Anzahl der Erfolge, X. .

Also ist V.einr(X.)=np(1- -p) , was Sie haben (Standardabweichung im Quadrat).

Da ein Anteil die Anzahl der Erfolge über die Anzahl der Versuche ist, haben wir:

V.einr(X.n)=V.einr(X.)n2=np(1- -p)n2=p(1- -p)n .

Und somit ist die Standardabweichung natürlich p(1- -p)n .

In einem Fall betrachten Sie die Anzahl, in dem anderen Fall die Anzahl geteilt durch die Stichprobengröße.

Intuitiv können Sie sich vorstellen, dass die Anzahl der Erfolge viel höher ist ( X.=0,1,2,,n ) als ein Anteil ( 0p1 ). Wenn n zunimmt, kann X. viele verschiedene (und größere) ganzzahlige Werte annehmen und weist eine größere Variabilität auf; p ist dagegen zwischen 0 und 1 begrenzt. X. hat also mehr Variabilität.

Underminer
quelle
Wie bist du zu ? Warum ist der Nennern2? V.einr(X.n)=V.einr(X.)n2n2
user490895
also V a r ( c X ) = E ( c 2 X 2 ) - [ c E ( X ) ] 2 = c 2 E ( X 2 ) - c 2 E ( X ) 2V.einr(X.)=E.(X.2)- -[E.(X.)]]2V.einr(cX.)=E.(c2X.2)- -[cE.(X.)]]2 =c2E.(X.2)- -c2E.(X.)2 = c 2 V a r ( X ) . Hier ist c = 1 / n . Ich habe einen Tippfehler in der dritten Gleichheit der Antwort gemacht, die ich jetzt beheben werde. =c2(E.(X.2)- -[E.(X.)]]2) =c2V.einr(X.)c=1/.n
Underminer
0

Okay! Ich mache es sehr einfach.

Wenn Sie den Standard und die Varianz normalerweise verwenden, blicken Sie zurück, versuchen zu sehen, was los ist, und projizieren dann die Zukunft. Je mehr Sie nach hinten schauen, desto mehr Informationen erhalten Sie normalerweise. Immer mehr Versuche helfen dabei, das Geschehene einzugrenzen. und Sie drehen sich jetzt besser um den Mittelwert. Std und var drehen sich nur um den Mittelwert, damit Sie immer näher an das heranrücken, was passieren wird.

Binomial ist anders! Wir wissen bereits, was los ist, wir kennen die Wahrscheinlichkeit. Rückblick ist also nicht so nützlich, weil wir die Wahrscheinlichkeit bereits kennen. Immer mehr Versuche helfen uns nicht, immer besser zu verstehen, wie sich die Dinge um den Mittelwert drehen, sondern geben uns nur eine immer breitere Verteilung. Das Erhöhen der Versuche gibt wirklich nur mehr Raum für Varianz.

Stellen Sie sich zwei Szenarien vor: eine, bei der Sie wissen möchten, wie groß jeder in einem Raum ist. mehr Messungen = näher an der tatsächlichen durchschnittlichen Höhe im Raum, Sie sind für jede neue Messung dankbar.

Zweitens hast du eine Münze. Sie wissen bereits, was der Durchschnitt ist. Es ist 50/50. Ich meine, an diesem Punkt sind Sie fertig. Stellen wir uns also vor, Sie fangen an zu flippen. Nun, jeder neue Flip bietet nur mehr Raum für Fehler. du drehst 10 mal um und du bekommst alle 10 Köpfe, du sagst zu deinem Freund, was zum Teufel! Wo waren die Chancen dafür, das ist so dumm! Nun, wenn Sie es nur einmal umgedreht hätten, hätten Sie nur eine Chance für einige verrückte Ausreißer gehabt. Mehr Flips geben dir nicht wirklich mehr Informationen, sie geben nur mehr Raum für verrückte Ergebnisse.

0 Mathe und 0 Formeln, hoffe das hilft.

Zack Flüsse
quelle
0

Wenn Sie nach einer Intuition für dieses Ergebnis suchen, fragen Sie sich, welches der folgenden Dinge variabler ist:

  • ... der Frauenanteil in einem Haushalt oder der Frauenanteil in einem ganzen Land?

  • ... die Anzahl der Frauen in einem Haushalt oder die Anzahl der Frauen in einem ganzen Land?

Ben - Monica wieder einsetzen
quelle