Sollte ich beim Umwerfen von Münzen eine Binomial-CD oder eine normale CD verwenden?

11

Eine Münze muss auf Fairness geprüft werden. 30 Köpfe kommen nach 50 Flips hoch. Angenommen, die Münze ist fair, wie hoch ist die Wahrscheinlichkeit, dass Sie mindestens 30 Köpfe in 50 Flips erhalten?

Der richtige Weg, um dieses Problem zu lösen, ist laut meinem Lehrer

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Ich habe jedoch eine solche binomiale kumulative Verteilungsfunktion übernommen

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Ich glaube, die Kriterien für eine Binomialverteilung sind erfüllt: Die einzelnen Ereignisse sind unabhängig, es gibt nur zwei mögliche Ergebnisse (Kopf gegen Zahl), die Wahrscheinlichkeit für die Frage ist konstant (0,5) und die Anzahl der Versuche ist auf 50 festgelegt Offensichtlich geben die beiden Methoden unterschiedliche Antworten, und eine Simulation unterstützt meine Antwort (zumindest die wenigen Male, die ich ausgeführt habe; natürlich kann ich nicht garantieren, dass Sie die gleichen Ergebnisse erzielen).

Ist mein Lehrer falsch in der Annahme, dass eine Normalverteilungskurve auch ein gültiger Weg wäre, um dieses Problem zu lösen (zu keinem Zeitpunkt wird gesagt, dass die Verteilung Normal ist, aber n * p und n * (1-p) sind beide größer als 10), oder habe ich etwas über Binomialverteilungen falsch verstanden?

waiwai933
quelle
5
Eine Person mit Erfahrung in der Verwendung normaler Näherungen an das Binomial würde etwas anders vorgehen: Sie würde die (übliche) Kontinuitätskorrektur anwenden , wie in 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(dies ist ein R-Ausdruck), dessen Wert 0,1015 beträgt, in ziemlich enger Übereinstimmung mit dem Binomial-cdf .
whuber

Antworten:

10

Hier ist eine Illustration der Antworten von Whuber und Onestop.

Kontinuitätskorrektur

In rot die Binomialverteilung , in schwarz die Dichte der Normalnäherung N ( 25 , 12,5 ) und in blau die Oberfläche entsprechend P ( Y > 29,5 ) für Y N ( 25 , 12,5) ) .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

Die Höhe eines roten Balkens, der für X B i n ( 50 , 0,5 ) entspricht, wird durch P ( k - 1 gut angenähertP(X=k)XBin(50,0.5). Um eine gute Annäherung anP(X30) zu erhalten, müssen SieP(Y>29,5) verwenden.P(k12<Y<k+12)P(X30)P(Y>29.5)

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194::

P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.
Elvis
quelle
4

Die Normalverteilung nähert sich dem Binomial näher an, wenn Sie eine Kontinuitätskorrektur verwenden . Wenn ich dies für Ihr Beispiel verwende, erhalte ich 0,1015. Da dies Hausaufgaben sind, überlasse ich es Ihnen, die Details einzugeben.

ein Stop
quelle
4

Bedenken Sie. In der diskreten Binomialverteilung haben Sie tatsächliche Wahrscheinlichkeiten für einzelne Zahlen. In der kontinuierlichen Normalen, die nicht der Fall ist, benötigen Sie einen Wertebereich. Also ... wenn Sie die Wahrscheinlichkeit eines einzelnen Wertes, sagen wir X, aus dem Binomial mit dem Normalen annähern würden, wie würden Sie das tun? Sehen Sie sich ein Wahrscheinlichkeitshistogramm der Binomialverteilung mit der darüber liegenden Normalkurve an. Sie müssten tatsächlich aus X ± 0,5 auswählen, um etwas zu erfassen, das der Binomialwahrscheinlichkeit von X mit der normalen Näherung ähnelt.

Erweitern Sie dies nun auf die Auswahl eines Endes der Distribution. Wenn Sie die Binomialmethode verwenden, wählen Sie die Wahrscheinlichkeit Ihres gesamten Werts (in Ihrem Fall 30) plus alles Höhere aus. Wenn Sie also die kontinuierliche Verteilung durchführen, müssen Sie sicherstellen, dass Sie dies erfassen und auch 0,5 weniger auswählen, sodass der Grenzwert für die kontinuierliche Verteilung 29,5 beträgt.

John
quelle
3
Tatsächlich zeigt die Frage ein durchdachtes Verständnis des Problems und scheint nicht nach einer Antwort auf eine routinemäßige Hausaufgabenfrage zu suchen. Obwohl es sich um Hausaufgaben handelt , sollten Sie hier eine Ausnahme machen. Insbesondere wäre eine gute Diskussion über die Verwendung der Normalverteilung zur Approximation diskreter Verteilungen (wie Binomialzahlen und Poissons mit großen Ns) angebracht und hier sehr willkommen.
whuber