Wie oft muss ein Ereignis mit bekannter Wahrscheinlichkeit wiederholt werden, bevor es mehrmals aufgetreten ist?

7

Wenn ich eine bekannte Wahrscheinlichkeit habe, dass ein Ereignis eintritt, eine Wahrscheinlichkeit von 1%, und ich möchte, dass das Ereignis mehrmals, 120 Mal, auftritt, ungefähr wie oft müsste ich das Ereignis wiederholen, bevor ich damit rechnen kann, dass es diese Zahl eintritt von Zeiten?

Dylan
quelle
17
Wie sicher möchten Sie sein, dass das Ereignis so oft stattgefunden hat?
Jake Westfall
Ein 100-maliges Ausführen eines solchen Experiments hätte eine Fehlerrate von 1 in e. Um jakes Punkt zu sagen, brauchen wir mehr Details, um eine gültige Antwort zu geben.
JTP - Entschuldigen Sie sich bei Monica
1
120-mal ein Ereignis zu erwarten und 120-mal ein Ereignis zu benötigen, sind ganz andere Dinge.
Mooing Duck
Irgendwo zwischen 120 und unendlich.
Bob Jarvis - Stellen Sie Monica am

Antworten:

19

Betrachten Sie eine Folge von unabhängigen Versuchen mit der Erfolgswahrscheinlichkeit . Sei die Anzahl der Erfolge aus den Versuchen. Dann hat eine Binomialverteilung mit den Parametern und . Der erwartete Wert eines Binomial rv ist . Ein einfacher Ansatz besteht darin, dies auf und nach lösen . Da , haben wir was bedeutet, dass Versuche Erfolge erwarten .npXnXnpE(X)=np120np=0.01n(0.01)=120n=12,000120


Alternativ ist hier ein verwandter Ansatz, der die Anzahl der Versuche angibt, die erforderlich sind, um Erfolge mit einer gewissen Wahrscheinlichkeit (dh ) zu beobachten.r=120γγ=0.95

Betrachten Sie eine Folge unabhängiger Versuche mit Erfolgswahrscheinlichkeit . Sei die Anzahl der Versuche, die erforderlich sind, um Erfolge zu beobachten . Dann hat eine negative Binomialverteilung mit den Parametern und . In Ihrem Fall , und Sie möchten so finden, dasspXrXrpX.Negativ-Binomial(120,0,01)x

P.(X.x)=γ.

Obwohl die negative Binomialverteilung keine Quantilfunktion in geschlossener Form hat, kann dieses leicht gelöst werden. Zum Beispiel kann die Antwort in R erhalten werden, indem Sie Folgendes eingeben : . Die Antwort zeigt an, dass Studien erforderlich sind, um eine 95% ige Chance zu haben, (oder mehr) Erfolge zu beobachten.xqnbinom(.95, 120, .01)x=1372813,728120

knrumsey
quelle
1
Die erste Methode entspricht der zweiten mit , richtig? γ=0,5
jpmc26
@ jpmc26 Ich bekomme 0.5556 für 12000. Ich habe qnbinom(.5556, 120, .01)hier verwendet: rextester.com/l/r_online_compiler
Maxter
@ jpmc26, die erste Methode gibt eine ähnliche Antwort auf die zweite mit .. aber sie sind nicht äquivalent. Der erste Ansatz ist die erwartete Anzahl von Versuchen (der Mittelwert) und der zweite Ansatz kann als die mittlere Anzahl von Versuchen angesehen werden. γ=0,5
Knrumsey
5

Zunächst gehe ich davon aus, dass die Experimente unabhängig sind, da Sie sagten, dass der wahrscheinliche Erfolg immer 1% beträgt. Das Schlüsselwort in Ihrer Frage lautet "erwartet". Dies bedeutet, dass wir nach einem Mittelwert oder einem erwarteten Wert suchen .

Wenn Sie an der Anzahl der Versuche (mit gemeinsamer Erfolgswahrscheinlichkeit ) interessiert sind , die erforderlich sind, um Erfolge zu erzielen , können Sie dies als negative binomiale Zufallsvariable mit Wahrscheinlichkeitsmassenfunktion modellieren:X.pr

fX.(x|r,p)=(x- -1r- -1)pr(1- -p)x- -r

fürx=r,r+1,...,

Der erwartete Wert des negativen Binomials ist bekannt als:

E.(X.)=rp

In Ihrem Fall ist und . Die erwartete Anzahl unabhängiger Versuche Ihres Experiments (Zeiten), die erforderlich sind, um Erfolge zu erzielen, wird einfach durchp=0,01r=120120120/.0,01=12,000

StatsStudent
quelle
Nitpick: Zu sagen, dass die Wahrscheinlichkeit immer 1% beträgt, ist nicht dasselbe wie die Versuche, unabhängig zu sein
DreamConspiracy
1
@ DreamConspiracy, hier kein Streit. Ich habe aus der Beschreibung des OP geschlossen. Im Fall eines NB PMF mit unabhängigen Ereignissen wäre es notwendigerweise so, dass die Ereigniswahrscheinlichkeit konstant ist.
StatsStudent
1

Wie andere angemerkt haben, folgt die Chance auf genügend Erfolg einer negativen Binomialverteilung. Es ist nützlich, dies zu zeichnen, und Sie können dies in R tun mit:

plot(function(x) pnbinom(x,120,0.01),120,20000)

Welches gibt:

Negative Binomialverteilung

Wie Sie sehen können, hat es eine Sigmoidform und es gibt große Gebiete mit praktisch keiner Chance und fast Sicherheit und einer schnellen Verschiebung zwischen den beiden nahe am erwarteten Wert. Daher kann eine Erhöhung der Anzahl der Versuche nur geringe oder sehr große Auswirkungen auf die Chance haben, das Ziel zu erreichen, je nachdem, für wie viele Sie sich bereits entschieden haben.

Wenn Sie diese Funktion anhand der Anzahl der Trails (dh der mittleren Chance pro Versuch) skalieren, können Sie sehen, dass es einen eindeutigen Maximalwert gibt.

plot(function(x) pnbinom(x,120,0.01)/x,120,20000)

Mittlere Chance pro Versuch

mit denen Sie sich identifizieren können:

optimise(function(x) pnbinom(x,120,0.01)/x,c(120,20000),maximum=TRUE)
$maximum
[1] 13888

$objective
[1] 6.929301e-05
James
quelle
-1

Wie Knrumsey sagt, folgt die Anzahl der Erfolge einer Binomialverteilung. Wenn Sie jedoch keine hohe Genauigkeit benötigen, ist 1% eine ausreichend kleine Zahl, um die Annäherung einer Poisson-Verteilung mitλ=1201%.99%.=1.2121

Akkumulation
quelle
4
Wie genau würde man diese Poisson-Distribution "verwenden", um die Frage zu beantworten?
whuber
Und warum multiplizieren Sie mit (anstatt sie durch die anderen zu teilen)? 1201%.
Henry
2
1.2 was? Versuche?
qwr
1
Ich mag die Idee, die Poisson-Distribution zu verwenden, und bin froh, dass Sie sie angesprochen haben, aber Ihre Antwort ist derzeit falsch. Wenn der Wert des Poisson CDF und die gewünschte Chance ist, mindestens Vorkommen zu beobachten, können Sie diese Frage so formulieren, dass Sie das kleinste für das wobeiDie Antwort bezieht sich nicht auf eine Poisson- Verteilung ! Interessant ist der Zusammenhang mit der Gamma-Verteilung: Die Lösung ist wobei das GammaF.(k,μ)(μ)1- -αnnF.(120- -1,nλ)αλ=1/.100.(120×1/.100/.(1- -1/.100))F.120- -1- -1(1- -α)F.120- -1(120- -1)CDF.
whuber