Ich bin ein Neuling in der Statistik. Wenn ich hier falsche Annahmen mache, sag es mir bitte.
Es gibt eine Bevölkerung N
von Menschen. (Zum Beispiel N
können 1.000.000 sein.) Einige der Leute sind Rothaarige. Ich nehme eine Stichprobe n
von Menschen (sagen wir 10) und finde, dass es sich j
bei ihnen um Rothaarige handelt.
Was kann ich über den allgemeinen Anteil der Rothaarigen an der Bevölkerung sagen? Ich meine, meine beste Annäherung ist wahrscheinlich j/n
, aber was wäre die Standardabweichung dieser Annäherung?
Was ist übrigens der akzeptierte Begriff dafür?
standard-deviation
sample-size
binomial
standard-error
Ram Rachum
quelle
quelle
Antworten:
Sie können sich dies als Binomialversuch vorstellen - Ihre Versuche sind Stichproben von "Rotschopf" oder "Nicht-Lesekopf". In diesem Fall können Sie ein Konfidenzintervall für Ihren Stichprobenanteil ( ) erstellen, wie auf Wikipedia dokumentiert:j / n
Ein 95% -Konfidenzintervall besagt grundsätzlich, dass bei Verwendung des gleichen Stichprobenalgorithmus, wenn Sie dies 100 Mal wiederholen, der wahre Anteil 95 Mal im angegebenen Intervall liegt.
Update Übrigens denke ich, dass der Begriff, den Sie suchen, ein Standardfehler sein könnte, der die Standardabweichung der abgetasteten Proportionen ist. In diesem Fall ist es wobei Ihr geschätzter Anteil ist. Beachten Sie, dass mit zunehmendem der Standardfehler abnimmt. pnp ( 1 - p )n- -- -- -- -- -√ p n
quelle
Wenn Ihre Stichprobengröße nicht so ein winziger Bruchteil der Populationsgröße wie in Ihrem Beispiel, und wenn Sie ersatzlos [Sw / oR] beproben, ist ein besserer Ausdruck für die [geschätzte] SEN.n N
Dabei ist der geschätzte Anteil und . j/n q =1 - pp^ j/n q^=1−p^
[Der Begriff wird als FPC [endliche Populationskorrektur] bezeichnet.N−nN
Obwohl die Bemerkung von whuber technisch korrekt ist, scheint sie darauf hinzudeuten, dass nichts getan werden kann, um beispielsweise ein Konfidenzintervall für den wahren Anteil . Wenn groß genug ist, um eine normale Näherung vernünftig zu machen [z . B. ], ist es unwahrscheinlich, dass man erhält . Wenn die Stichprobengröße groß genug ist, damit eine normale Annäherung unter Verwendung der wahren angemessen ist, ergibt die Verwendung von stattdessen auch eine vernünftige Annäherung.n n p > 10 j = 0 S E ^ S E.p n np>10 j=0 SE SE^
[Wenn Ihr wirklich klein ist und Sie Sw / oR verwenden, müssen Sie möglicherweise die exakte hypergeometrische Verteilung für anstelle einer normalen Näherung verwenden. Wenn Sie SwR machen, ist die Größe von irrelevant und Sie können exakte Binomialmethoden verwenden, um ein CI für .]j N pn j N p
In jedem Fall könnte man, da , immer konservativ sein und anstelle von oben. Wenn Sie dies tun, wird eine Stichprobe von , um eine geschätzte ME [Fehlerquote = 2 ] von .03 [unabhängig davon, wie groß ist!] zu erhalten.1p(1−p)≤1/4 √12n√ n=1,111^SE±N.p^q^n−−−√ n=1,111 SE^ ± N
quelle