Wie bestimmen Sie den Stichprobenumfang bei der Befragung einer großen Population?

15

Australien hat derzeit Wahlen und verständlicherweise berichten die Medien täglich über neue politische Wahlergebnisse. In einem Land mit 22 Millionen Einwohnern müsste wie viel Prozent der Bevölkerung beprobt werden, um ein statistisch gültiges Ergebnis zu erhalten?

Ist es möglich, dass die Verwendung einer zu großen Stichprobe die Ergebnisse beeinflusst, oder steigt die statistische Validität monoton mit der Stichprobengröße an?

brotchie
quelle

Antworten:

13

Die Stichprobengröße hängt nicht wesentlich von der Populationsgröße ab, was für viele nicht intuitiv ist.

Die meisten Umfrageunternehmen verwenden 400 oder 1000 Personen in ihren Stichproben.

Dafür gibt es einen Grund:

Bei einer Stichprobengröße von 400 erhalten Sie ein Konfidenzintervall von +/- 5%, das 19-fache von 20 (95%).

Bei einer Stichprobengröße von 1000 erhalten Sie ein Konfidenzintervall von +/- 3%, das 19-fache von 20 (95%).

Wenn Sie sowieso einen Anteil nahe 50% messen.

Dieser Rechner ist nicht schlecht:

http://www.raosoft.com/samplesize.html

Neil McGuigan
quelle
6
Beachten Sie jedoch, dass dies alles auf Stichproben aus einer homogenen Population beruht. Wenn Sie eine heterogene Population haben (z. B. unterschiedliche Anteile für verschiedene Untergruppen, Stichproben seltener Teile der Populationen), ist diese Varianzschätzung nicht so zuverlässig. Die Schätzungen, die Sie hier tatsächlich berechnen, beziehen sich (glaube ich) auf eine Population, die Ihre Stichprobe darstellt. Die Frage ist: Ist diese Bevölkerung diejenige, die Sie tatsächlich interessiert?
Wahrscheinlichkeitslogik
9

Angenommen, Sie möchten wissen, wie viel Prozent der Menschen für einen bestimmten Kandidaten stimmen würden (sagen wir , beachten Sie, dass π per Definition zwischen 0 und 100 liegt). Sie wählen N Wähler nach dem Zufallsprinzip aus, um herauszufinden, wie sie abstimmen würden. Aus Ihrer Umfrage unter diesen N Wählern geht hervor, dass der Prozentsatz p beträgt . Sie möchten also ein Konfidenzintervall für den tatsächlichen Prozentsatz festlegen.ππNNp

pNπ

Cich=[p-ksd(p),  p+ksd(p)]
k

MoE=ksd(p)

sd(p)p=Xich/NXich=1ich0

Xich

Veinr(P)=V(XichN)=V(Xich)N2=Nπ(1-π)N2=π(1-π)N.
sd(p)=π(1-π)N
πsd(p)π=0,5
sd(p)=0,50,5/N=0,5/N
NN

k=1,96N=1000

[p-1,960,51000,  p+1,960,51000]=[p-0,03,  p+0,03]
NNπ=50%
Gemeinschaft
quelle
2

Als grobe Verallgemeinerung erhalten Sie immer dann eine andere Antwort, wenn Sie einen Bruchteil der Personen in einer Population befragen, als wenn Sie dieselbe Zahl erneut befragen (aber möglicherweise andere Personen).

Wenn Sie also herausfinden möchten, wie viele Menschen in Australien> = 30 Jahre alt sind, und wenn der wahre Bruchteil (Gott sagte es uns) zufällig genau 0,4 ist, und wenn wir 100 Menschen fragen, die durchschnittliche Zahl, mit der wir rechnen können Sagen wir, sie sind> = 30 ist 100 x 0,4 = 40 und die Standardabweichung dieser Zahl ist +/- sqrt (100 * 0,4 * 0,6) = sqrt (24) ~ 4,9 oder 4,9% (Binomialverteilung).

Da sich diese Quadratwurzel dort befindet, verringert sich die Standardabweichung um das 10-fache, wenn die Stichprobengröße um das 100-fache erhöht wird. Um die Unsicherheit einer solchen Messung im Allgemeinen um den Faktor 10 zu verringern, müssen Sie 100-mal so viele Personen abtasten. Wenn Sie also 100 x 100 = 10000 Personen befragen, steigt die Standardabweichung auf 49 oder in Prozent auf 0,49%.

Mike Dunlavey
quelle