Ich bin daran interessiert, den Unterschied zwischen der "Wahrscheinlichkeit" eines zufälligen Ereignisses und einer bestimmten Wahrscheinlichkeit, die tatsächlich auftritt, genau so zu verstehen, wie es als wahrscheinlich bezeichnet wird. dh wenn ein Ereignis eine Wahrscheinlichkeit von 1 zu 10000 hat, wie hoch ist die Wahrscheinlichkeit, dass es in 10000 Versuchen genau 1 Mal auftritt, nicht 2 Mal, nicht 0 Mal, nicht 3 Mal usw. und wie drückt man es aus (und erklärt es)? die Abweichung?
Wenn ein Ereignis eine Wahrscheinlichkeit von 1: 10.000 hat, würde es in 100.000 Versuchen wahrscheinlich zehnmal auftreten. In 1.000.000 Versuchen würde es wahrscheinlich 100-mal auftreten, aber es wäre auch nicht genauso wahrscheinlich, dass es in einem bestimmten Satz von 1.000.000 Versuchen beliebig oft auftritt, zum Beispiel: 98-mal, 99-mal, 101-mal, 96 Zeiten, 102 Mal usw.
Statistisch gesehen, wie viele Versuche müssen gemittelt und berücksichtigt werden, um eine statistische Sicherheit zu erreichen, dass ein bestimmtes Ergebnis tatsächlich 1: 10000 und nicht 1: 9999 oder 1: 10001 oder 1: 10000,5 usw. ist?
quelle
Antworten:
Bearbeiten: Wie Mark L Stone zu Recht betont, habe ich Ihre Frage so verstanden, dass die Versuche unabhängig sind, ohne festzustellen, dass dies der Fall ist. Dies ist eine kritische Annahme (und in vielen Situationen möglicherweise nicht sinnvoll). Trotzdem werde ich auf dieser Basis weiter antworten, weil ich weiterhin denke, dass es Ihre Absicht war.
Nicht ganz: 99 und 100 haben die gleiche Chance, aber alles andere hat eine geringere Chance:
(Die Wahrscheinlichkeit sinkt weiter, wenn Sie sich weiter nach außen bewegen).
Sie können nicht sicher sein, dass es tatsächlich 1/10000 ist, da Sie willkürlich nah dran sein können, sich aber davon unterscheiden.
Ja, es könnte bei 10000 Versuchen oder 1000 oder 100 gefragt werden.
Vereinfachen wir die Dinge und führen 10000 Versuche und 98 Erfolge durch. Man könnte natürlich als Punktschätzung die Erfolgswahrscheinlichkeit 98/10000 = 0,0098 nehmen, aber dies ist nicht der zugrunde liegende Anteil, sondern nur eine Schätzung davon. Es kann durchaus 0,944 ... oder 0,997 ... oder eine beliebige Anzahl anderer Werte sein.
Eine Sache, die Menschen tun, ist, ein Intervall von Werten zu konstruieren , das (in gewissem Sinne) einigermaßen mit dem beobachteten Anteil übereinstimmt. Es gibt zwei Hauptphilosophien der Statistik (Bayes'sche und frequentistische Statistik), die in großen Stichproben normalerweise ähnliche Intervalle erzeugen, aber ziemlich unterschiedliche Interpretationen haben.
Ein typisches Bayes'sches Intervall würde mit einer vorherigen Verteilung des Parameters beginnen, der Ihre Unsicherheit über seinen Wert darstellt, und die Daten verwenden, um dieses Wissen darüber auf eine hintere Verteilung zu aktualisieren und daraus ein glaubwürdiges Intervall zu erhalten .
Konfidenzintervalle werden sehr häufig verwendet (obwohl ein glaubwürdiges Intervall Ihren Erwartungen an die Funktionsweise eines Intervalls möglicherweise näher kommt). Im Fall des Konfidenzintervalls für binomiale Proportionen gibt es wie hier verschiedene Ansätze, obwohl in großen Stichproben alle so ziemlich das gleiche Intervall ergeben.
Richtig; Sie würden erwarten (mit fairen Würfeln), dass Sie fast (aber nicht ganz) jedes Mal, wenn Sie es versuchen, zwischen 999,94 Millionen und 1000,06 Millionen Erfolg haben.
Es wird fast immer damit übereinstimmen (und mit einer Reihe anderer nahegelegener Werte). Was nicht passiert, ist nicht, dass Sie sagen können, dass es 1/10000 ist, sondern dass das Intervall der Wahrscheinlichkeitswerte, die mit Ihren Ergebnissen übereinstimmen, mit zunehmender Stichprobengröße enger wird.
quelle
Erläuterung:
Angenommen, ich würfle 6 Mal. Die Wahrscheinlichkeit,
1
mindestens einmal aus diesen 6 Versuchen herauszukommen, ist:Angenommen, ein Ereignis hat eine Wahrscheinlichkeit von
1/10000
. Die Wahrscheinlichkeit, dass dieses Ereignis mindestens einmal bei10000
Versuchen auftritt, ist:Wir können dies für jeden extrapolieren
n
und erhalten:Wenn wir diese Gleichung in Grapher darstellen , erhalten wir ungefähr Folgendes :
Schlussfolgerung: Obwohl dies durchaus sinnvoll ist, war ich tatsächlich ziemlich überrascht von der Tatsache, dass die Wahrscheinlichkeit, dass ein Ereignis mit mindestens einmal aus Versuchen , für as nahezu unabhängig von ist wenig wie bereits. nnn3p=1n n n n 3
quelle
Lassen Sie uns ein einfacheres Problem beim Würfeln feststellen. Ermöglicht die Berechnung
WahrscheinlichkeitWahrscheinlichkeit , dass auf 6 würfelt, steht es 1 genau einmal sein wird.Wie viele Möglichkeiten kann dies haben [und ihre jeweiligen Wahrscheinlichkeiten]:
Die Gesamtwahrscheinlichkeit, dass 1 nur einmal in 6 Würfen erzielt wird, beträgt (3125/46656) * 6 = 3125/7776
Sie können dieselbe Entwicklung für Ereignisse mit einer Wahrscheinlichkeit von 1 / n erweitern. Die Wahrscheinlichkeit, dass ein Ereignis in n Versuchen nur einmal auftritt, wäre
Das kommt mir vielleicht ein bisschen bekannt vor, wenn ich es neu anordne:
Ein anderer Teil Ihrer Frage: Die Verringerung der Abweichung mit zunehmender Anzahl von Stichproben wird bereits in einer anderen Antwort ausführlich erläutert.
quelle