Wahrscheinlichkeit von 10000: 1 Wahrscheinlichkeit tritt genau einmal in 10.000 Versuchen auf

8

Ich bin daran interessiert, den Unterschied zwischen der "Wahrscheinlichkeit" eines zufälligen Ereignisses und einer bestimmten Wahrscheinlichkeit, die tatsächlich auftritt, genau so zu verstehen, wie es als wahrscheinlich bezeichnet wird. dh wenn ein Ereignis eine Wahrscheinlichkeit von 1 zu 10000 hat, wie hoch ist die Wahrscheinlichkeit, dass es in 10000 Versuchen genau 1 Mal auftritt, nicht 2 Mal, nicht 0 Mal, nicht 3 Mal usw. und wie drückt man es aus (und erklärt es)? die Abweichung?

Wenn ein Ereignis eine Wahrscheinlichkeit von 1: 10.000 hat, würde es in 100.000 Versuchen wahrscheinlich zehnmal auftreten. In 1.000.000 Versuchen würde es wahrscheinlich 100-mal auftreten, aber es wäre auch nicht genauso wahrscheinlich, dass es in einem bestimmten Satz von 1.000.000 Versuchen beliebig oft auftritt, zum Beispiel: 98-mal, 99-mal, 101-mal, 96 Zeiten, 102 Mal usw.

Statistisch gesehen, wie viele Versuche müssen gemittelt und berücksichtigt werden, um eine statistische Sicherheit zu erreichen, dass ein bestimmtes Ergebnis tatsächlich 1: 10000 und nicht 1: 9999 oder 1: 10001 oder 1: 10000,5 usw. ist?

RobH
quelle
1) Was meinst du mit "statistischer Sicherheit"? 2) "Wahrscheinlichkeit" hat in Statistiken eine besondere technische Bedeutung, von der ich bezweifle, dass Sie dies beabsichtigen. Wenn Sie Wahrscheinlichkeit meinen , verwenden Sie stattdessen dieses Wort.
Glen_b -State Monica
Genau ... Ich bin mir nicht sicher über die genaue technische Bedeutung der beiden Begriffe "Wahrscheinlichkeit" und "Wahrscheinlichkeit" ... Ich meine, ich nehme an, die Wahrscheinlichkeit ist 1: 10000 (oder was auch immer die Wahrscheinlichkeit ist) Aber wenn ich zufällig etwas zeichne, das diese Wahrscheinlichkeit hat, heißt das nicht unbedingt, dass es genau 1 von 10000 Mal wahr wird, oder? Und was die "statistische Sicherheit" betrifft ... wie viele Versuche würden Sie benötigen, um die tatsächliche Wahrscheinlichkeit von etwas zu bestimmen, wenn empirische Daten zeigen, dass etwas, von dem angenommen wird, dass es 1: 10000 ist, tatsächlich 1: 9999 oder 1: 10001 usw. ist.
RobH
Vielen Dank für Ihre Antworten. Ich denke, ich frage mich, ob eine größere Stichprobe, dh 10.000.000 Versuche, 100.000.000 Versuche usw., zu einem näher am erwarteten Ergebnis von 1 pro 10.000 führt oder ob es immer eine Wahrscheinlichkeit gibt von ähnlicher Abweichung ....
RobH
Ja, es nähert sich immer enger 1 von 10000; Wenn die Anzahl der Versuche zunimmt (ich gehe davon aus, dass sie weit über 10000 liegt und zunimmt), konzentriert sich der Stichprobenanteil stärker auf den tatsächlichen (Bevölkerungs-) Anteil. Die Standardabweichung der Verteilung des Stichprobenanteils (sein Standardfehler ) nimmt proportional zu . Tatsächlich haben Sie für großesn(wiederum wesentlich mehr als 10000) ungefähr 95% der Wahrscheinlichkeit innerhalb vonp±11nnp±1n
Glen_b -Reinstate Monica
Vielen Dank für die Antworten. Lassen Sie mich jetzt ein Follow-up anfordern. Nehmen wir an, nach 10.000.000.000 Versuchen ist das Ergebnis 999.982 Mal aufgetreten. Würden Sie dann die Wahrscheinlichkeit für den nächsten Versuch angeben? 1: 9999.82 oder 1: 10000 oder ein berechnetes Ergebnis mit Abweichung? .. (Oder ich denke, das gleiche könnte nach nur 1 Satz von 10.000 Versuchen mit viel weniger Genauigkeit
gefragt werden

Antworten:

16

a 1 in 10000 Wahrscheinlichkeit, was ist die Wahrscheinlichkeit Wahrscheinlichkeit , dass es in 10000 Studien genau 1 Mal auftreten

1/e0.3679

Bearbeiten: Wie Mark L Stone zu Recht betont, habe ich Ihre Frage so verstanden, dass die Versuche unabhängig sind, ohne festzustellen, dass dies der Fall ist. Dies ist eine kritische Annahme (und in vielen Situationen möglicherweise nicht sinnvoll). Trotzdem werde ich auf dieser Basis weiter antworten, weil ich weiterhin denke, dass es Ihre Absicht war.

n1/nn

nn

Geben Sie hier die Bildbeschreibung ein

Wenn ein Ereignis eine Wahrscheinlichkeit von 1: 10.000 hat, würde es in 100.000 Versuchen wahrscheinlich zehnmal auftreten. In 1.000.000 Versuchen würde es wahrscheinlich 100-mal auftreten, aber es wäre auch nicht genauso wahrscheinlich, dass es in einem bestimmten Satz von 1.000.000 Versuchen beliebig oft auftritt, zum Beispiel: 98-mal, 99-mal, 101-mal, 96 Zeiten, 102 Mal usw.

Nicht ganz: 99 und 100 haben die gleiche Chance, aber alles andere hat eine geringere Chance:

Geben Sie hier die Bildbeschreibung ein

(Die Wahrscheinlichkeit sinkt weiter, wenn Sie sich weiter nach außen bewegen).

n=1000000p=1/10000

npλ=np=100

Wie viele Versuche müssen gemittelt und berücksichtigt werden, um eine statistische Sicherheit zu erreichen, dass ein bestimmtes Ergebnis tatsächlich 1: 10000 und nicht 1: 9999 oder 1: 10001 ist

Sie können nicht sicher sein, dass es tatsächlich 1/10000 ist, da Sie willkürlich nah dran sein können, sich aber davon unterscheiden.

nnpnp(1p)np

p=1/10000n=1012108104p=1/9999100,010,000n=4×10122n=1013

1013p=1/100001/9999

p(1/p)3p=1/(k±1)1/k

Nehmen wir an, nach 10.000.000.000 Versuchen ist das Ergebnis 999.982 Mal aufgetreten. Würden Sie dann die Wahrscheinlichkeit für den nächsten Versuch mit 1: 9999,82 oder 1: 10000 oder einem berechneten Ergebnis mit Abweichung angeben? .. (Oder ich denke, dasselbe könnte nach nur 1 Satz von 10.000 Versuchen mit viel weniger Genauigkeit gefragt werden!)

Ja, es könnte bei 10000 Versuchen oder 1000 oder 100 gefragt werden.

Vereinfachen wir die Dinge und führen 10000 Versuche und 98 Erfolge durch. Man könnte natürlich als Punktschätzung die Erfolgswahrscheinlichkeit 98/10000 = 0,0098 nehmen, aber dies ist nicht der zugrunde liegende Anteil, sondern nur eine Schätzung davon. Es kann durchaus 0,944 ... oder 0,997 ... oder eine beliebige Anzahl anderer Werte sein.

Eine Sache, die Menschen tun, ist, ein Intervall von Werten zu konstruieren , das (in gewissem Sinne) einigermaßen mit dem beobachteten Anteil übereinstimmt. Es gibt zwei Hauptphilosophien der Statistik (Bayes'sche und frequentistische Statistik), die in großen Stichproben normalerweise ähnliche Intervalle erzeugen, aber ziemlich unterschiedliche Interpretationen haben.

p

Ein typisches Bayes'sches Intervall würde mit einer vorherigen Verteilung des Parameters beginnen, der Ihre Unsicherheit über seinen Wert darstellt, und die Daten verwenden, um dieses Wissen darüber auf eine hintere Verteilung zu aktualisieren und daraus ein glaubwürdiges Intervall zu erhalten .

Konfidenzintervalle werden sehr häufig verwendet (obwohl ein glaubwürdiges Intervall Ihren Erwartungen an die Funktionsweise eines Intervalls möglicherweise näher kommt). Im Fall des Konfidenzintervalls für binomiale Proportionen gibt es wie hier verschiedene Ansätze, obwohl in großen Stichproben alle so ziemlich das gleiche Intervall ergeben.

Mit Würfeln führen selbst 6 x 10 ^ 9 Versuche möglicherweise nicht zu genau 1 x 10 ^ 9 für jedes der sechs Ergebnisse

Richtig; Sie würden erwarten (mit fairen Würfeln), dass Sie fast (aber nicht ganz) jedes Mal, wenn Sie es versuchen, zwischen 999,94 Millionen und 1000,06 Millionen Erfolg haben.

Wenn die tatsächliche Wahrscheinlichkeit 1: 10000 beträgt, würden zunehmende Versuche innerhalb der erwarteten Abweichung dies tendenziell bestätigen

Es wird fast immer damit übereinstimmen (und mit einer Reihe anderer nahegelegener Werte). Was nicht passiert, ist nicht, dass Sie sagen können, dass es 1/10000 ist, sondern dass das Intervall der Wahrscheinlichkeitswerte, die mit Ihren Ergebnissen übereinstimmen, mit zunehmender Stichprobengröße enger wird.

Glen_b -Reinstate Monica
quelle
Glen_b, Sie gehen davon aus, dass jeder Versuch unabhängig ist. Das mag das sein, was das OP beabsichtigt hat, aber der Mangel an Raffinesse in der Wahrscheinlichkeit des OP legt für mich nahe, dass das OP implizit eine Annahme der Unabhängigkeit macht, wie es vielleicht immer auf die Wahrscheinlichkeit anwendbar ist. Stellen Sie sich eine Zufallsvariable vor, für die 10000 Versuche durchgeführt werden, sodass das Ereignis mit der Wahrscheinlichkeit 9999/10000 bei Nullversuchen und mit der Wahrscheinlichkeit 1/10000 bei allen 10000 Versuchen auftritt. Das Ereignis hat eine Eintrittswahrscheinlichkeit von 1 zu 10000, und die Wahrscheinlichkeit, dass es bei 100000 Versuchen genau einmal auftritt, ist Null.
Mark L. Stone
Danke @ MarkL.Stone - Sie haben Recht, ich habe die Frage als Unabhängigkeit angesehen, aber ich hätte das ganz explizit sagen sollen. Ich werde einen Satz hinzufügen, um meine Antwort zu verdeutlichen.
Glen_b -Reinstate Monica
Ich gehe davon aus, dass jeder Versuch unabhängig ist: Wenn ich einen Behälter mit 10.000 Murmeln, 1 roten und 9.999 schwarzen hätte, wäre die Wahrscheinlichkeit, den roten Marmor beim ersten Versuch auszuwählen, 1: 10000 ... wenn Ich zeichne einen schwarzen Marmor, dann wäre die Wahrscheinlichkeit von Rot beim nächsten Versuch 1: 9999 und fahre fort, bis ich den roten Marmor zeichne. Danach wäre die Wahrscheinlichkeit 0. Ein Beispiel für einen unabhängigen Versuch würde bedeuten, dass jeder Marmor würde aus einem neuen Behälter mit 9999 schwarzen Murmeln und 1 roten Marmor genommen werden, richtig? Ja, das wollte ich beschreiben.
RobH
2

p=1nn

n1/e0.632n

Erläuterung:

Angenommen, ich würfle 6 Mal. Die Wahrscheinlichkeit, 1mindestens einmal aus diesen 6 Versuchen herauszukommen, ist:

Wahrscheinlichkeit, nicht bei jedem Versuch '1' zu erhalten:

p=56

Wahrscheinlichkeit, in 6 Versuchen keine '1' zu bekommen:

p=566

Wahrscheinlichkeit, mindestens einmal in 6 Versuchen '1' zu bekommen:

p=15660.665

Angenommen, ein Ereignis hat eine Wahrscheinlichkeit von 1/10000. Die Wahrscheinlichkeit, dass dieses Ereignis mindestens einmal bei 10000Versuchen auftritt, ist:

p=1999910000100000.634

Wir können dies für jeden extrapolieren nund erhalten:

p=1nn

p=1(n1n)n

Und seit:

limn+n1nn=limn+(11n)n=1e0.368

Wir können das sagen:

limn+1n1nn0.632

Wenn wir diese Gleichung in Grapher darstellen , erhalten wir ungefähr Folgendes :

Geben Sie hier die Bildbeschreibung ein

Schlussfolgerung: Obwohl dies durchaus sinnvoll ist, war ich tatsächlich ziemlich überrascht von der Tatsache, dass die Wahrscheinlichkeit, dass ein Ereignis mit mindestens einmal aus Versuchen , für as nahezu unabhängig von ist wenig wie bereits. nnn3p=1nnnn3

Jivan
quelle
0

Lassen Sie uns ein einfacheres Problem beim Würfeln feststellen. Ermöglicht die Berechnung Wahrscheinlichkeit Wahrscheinlichkeit , dass auf 6 würfelt, steht es 1 genau einmal sein wird.

Wie viele Möglichkeiten kann dies haben [und ihre jeweiligen Wahrscheinlichkeiten]:

1 is scored in first throw but not in any other throws[1/6*5/6*5/6*...] [=3125/46656]
1 is scored in second throw but not in any other throw [5/6*1/6*5/6*...] [=3125/46656]
...
...

Die Gesamtwahrscheinlichkeit, dass 1 nur einmal in 6 Würfen erzielt wird, beträgt (3125/46656) * 6 = 3125/7776

Sie können dieselbe Entwicklung für Ereignisse mit einer Wahrscheinlichkeit von 1 / n erweitern. Die Wahrscheinlichkeit, dass ein Ereignis in n Versuchen nur einmal auftritt, wäre

((n-1)/n)^(n-1)

Das kommt mir vielleicht ein bisschen bekannt vor, wenn ich es neu anordne:

(1-1/n)^(n-1)

Ein anderer Teil Ihrer Frage: Die Verringerung der Abweichung mit zunehmender Anzahl von Stichproben wird bereits in einer anderen Antwort ausführlich erläutert.

Geographisches Positionierungs System
quelle
Leider sind die hervorgehobenen Antworten falsch.
Dilip Sarwate