Wie oft muss ich einen Würfel werfen, um seine Fairness sicher zu beurteilen?

(Bitte entschuldigen Sie sich im Voraus für die Verwendung der Laiensprache anstelle der statistischen Sprache.)

Wenn ich die Wahrscheinlichkeit messen möchte, dass jede Seite eines bestimmten physischen sechsseitigen Würfels mit hinreichender Sicherheit auf +/- 2% gewürfelt wird, wie viele Musterwürfeln wären erforderlich?

Dh wie oft müsste ich einen Würfel werfen, wobei jedes Ergebnis gezählt wird, um zu 98% sicher zu sein, dass die Chancen, dass jede Seite gewürfelt wird, zwischen 14,6% und 18,7% liegen? (Oder ähnliche Kriterien, bei denen man zu 98% sicher ist, dass der Würfel innerhalb von 2% liegt.)

(Dies ist eine reale Angelegenheit für Simulationsspiele, bei denen Würfel verwendet werden und bei denen sichergestellt werden soll, dass bestimmte Würfelentwürfe eine annehmbare Wahrscheinlichkeit von 1/6 haben. Es wird behauptet, dass bei vielen gängigen Würfelentwürfen das Würfeln um 29% 1 gemessen wurde mehrere solcher Würfel jeweils 1000-mal würfeln.)

probability inference pdf dice Dronz
quelle

Dies ist viel schwieriger, als das Konfidenzintervall für ein Binomial zu ermitteln, da Sie alle Wahrscheinlichkeiten in Schach halten möchten. Schauen Sie sich Hsiuying Wangs Artikel über simultane Konfidenzintervalle für multinomiale Verteilungen an ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). In diesem Blog-Beitrag finden Sie Code , der auch eine kurze Zusammenfassung einiger der Arbeiten enthält, die an diesem Thema durchgeführt wurden.

IDNAVID

Beachten Sie, dass dies die Frage sehr vereinfacht, wenn Sie nur prüfen möchten, ob Einsen in angemessener Zeit gewürfelt wurden.

Dennis Jaheruddin

Es ist wichtig zu beachten, dass das "Konfidenzintervall" keine "prozentuale Wahrscheinlichkeit der Richtigkeit" ergibt. Ich vermute, dass Sie die sehr vernünftige Verwendung des Begriffs "98% sicher" verwenden, aber Sie müssen wissen, wann immer jemand ein "Konfidenzintervall" erwähnt, das überhaupt nicht mit einer 98% igen Wahrscheinlichkeit übereinstimmt: link.springer.com/ article / 10.3758% 2Fs13423-013-0572-3

BrianH

@BrianH Danke! Ich habe nicht nur den umgangssprachlichen Ausdruck gemeint, sondern möchte die durch den Test implizierte Gewissheit quantifizieren. Meines Erachtens ist es in der gleichen Weise sinnvoll zu sagen, dass ich davon ausgehe, dass ein Würfelergebnis in einem berechenbaren Prozentsatz der Zeit gewürfelt wird, dass es eine ähnliche (aber komplexere) Berechnung dafür geben würde, wie wahrscheinlich es ist, dass Ergebnisse gewürfelt werden Eine gewisse Fehlerquote beim n-maligen Würfeln, was meiner Meinung nach die Antwort von Xiamoi (und der nachfolgende Kommentar) ist. Ja?

Dronz

@Dronz Um fair zu sein, dies ist eines der Dinge, von denen du wirklich denkst, dass sie direkter sind, als es sich tatsächlich herausstellt. Tatsächlich teuflisch knifflig. Hier einige wichtige Fragen an anderer Stelle , um Hilfe geben Ihnen eine Vorstellung davon , wie es ist kein unglaublich geradlinig Antwort: frequentistischen math.stackexchange.com/questions/1578932/... Bayesian math.stackexchange.com/questions/1584833/... und Spaß: rpg.stackexchange.com/questions/70802/…

BrianH

Antworten:

TL; DR: wenn = 1/6 und Sie wollen wissen , wie groß Bedürfnisse 98% sicher sein , die Würfel fair (innerhalb von 2%), Bedürfnisse werden mindestens ≥ 766 . $p$ $n$ $n$ $n$

Sei die Anzahl der Rollen und die Anzahl der Rollen, die auf einer bestimmten Seite landen. Dann folgt einer Binomialverteilung (n, p), wobei die Wahrscheinlichkeit ist, diese spezifizierte Seite zu erhalten. $n$ $X$ $X$ $p$

Nach dem zentralen Grenzwertsatz wissen wir das

\sqrt{n} (X / n - p) \to N (0, p (1 - p))

$\sqrt{n} (X/n - p) \to N(0,p(1-p))$

Da der Stichprobenmittelwert von Bernoulli Zufallsvariablen ist. Daher können für große Konfidenzintervalle für wie folgt konstruiert werden $X/n$ $n$ $(p)$ $n$ $p$

\frac{X}{n} \pm Z \sqrt{\frac{p (1 - p)}{n}}

$\frac{X}{n} \pm Z \sqrt{\frac{p(1-p)}{n}}$

Da unbekannt ist, können wir es durch den Stichprobenmittelwert ersetzen und durch verschiedene Konvergenzsätze wissen wir, dass das resultierende Konfidenzintervall asymptotisch gültig ist. So erhalten wir Konfidenzintervalle der Form $p$ $\hat{p} = X/n$

\hat{p} \pm Z \sqrt{\frac{\hat{p} (1 - \hat{p})}{n}}

$\hat{p} \pm Z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$

mit . Ich gehe davon aus, dass Sie wissen, was Scores sind. Wenn Sie beispielsweise ein Konfidenzintervall von 95% wünschen, nehmen Sie . Also haben wir für ein gegebenes Konfidenzniveau $\hat{p} = X/n$ $Z$ $Z=1.96$ $\alpha$

\hat{p} \pm Z_{α} \sqrt{\frac{\hat{p} (1 - \hat{p})}{n}}

$\hat{p} \pm Z_\alpha \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$

Angenommen, Sie möchten, dass dieses Konfidenzintervall kürzer als , und möchten wissen, wie groß eine Stichprobe ist, die wir für diesen Fall benötigen. Nun, dies ist gleichbedeutend mit der Frage, was erfüllt $C_\alpha$ $n_\alpha$

Z_{α} \sqrt{\frac{\hat{p} (1 - \hat{p})}{n_{α}}} \leq \frac{C_{α}}{2}

$Z_\alpha \sqrt{\frac{\hat{p}(1-\hat{p})}{n_\alpha}} \leq \frac{C_\alpha}{2}$

Was ist dann gelöst zu erhalten

n_{α} \geq {(\frac{2 Z_{α}}{C_{α}})}^{2} \hat{p} (1 - \hat{p})

$n_\alpha \geq \left(\frac{2 Z_\alpha}{C_\alpha}\right)^2 \hat{p}(1-\hat{p})$

Geben Sie also Ihre Werte für , und Estimated , um eine Abschätzung für . Da unbekannt ist, handelt es sich nur um eine Schätzung, asymptotisch (wenn größer wird) sollte es jedoch genau sein. $Z_\alpha$ $C_\alpha$ $\hat{p}$ $n_\alpha$ $p$ $n$

Xiaomi
quelle

Vielen Dank. Da ich jahrzehntelang keine Hochschulmathematik mehr gemacht habe, kann ich Ihnen Schwierigkeiten bereiten, die Zahlen einzugeben und mir tatsächlich die Anzahl zu geben, mit der ich einen Würfel als Ganzzahl würfeln muss?

Dronz

Wenn und Sie wissen möchten, wie groß muss, um 98% sicher zu sein, dass der Würfel innerhalb von 2% liegt, muss mindestens . Ignoriere meinen letzten Kommentar, verwende falsches .

p = 1 / 6

$p = 1/6$

n

$n$

n

$n$

n \geq 766

$n \geq 766$

C_{α}

$C_\alpha$

Xiaomi

Es könnte interessanter sein, die Multinomialverteilung zu betrachten, da wir jetzt für jede Seite separat testen. Dabei werden nicht alle Informationen berücksichtigt, die wir zu dem Problem haben. Für einen intiuitive Erklärung Blick auf stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm

Jan

Ich stimme @Jan zu: Diese Antwort beantwortet die Frage nicht. Darüber hinaus ist es nicht einfach, eine Antwort zu konstruieren, indem sie separat auf alle sechs Flächen angewendet wird, da die sechs Tests voneinander abhängig sind.

Whuber

Dies ist eine schöne Antwort, aber ich stimme voll und ganz mit Jan überein, whuber. Diese Frage verdient eine Antwort auf der Grundlage der Chi-Quadrat-Statistik und der multinomialen Verteilung.

Łukasz Grad