Wie kann ich die Fairness eines zwanzigseitigen Würfels testen (d20)? Offensichtlich würde ich die Werteverteilung mit einer Gleichverteilung vergleichen. Ich erinnere mich vage an einen Chi-Quadrat-Test im College. Wie kann ich das anwenden, um zu sehen, ob ein Würfel fair ist?
29
Antworten:
Hier ist ein Beispiel mit R-Code. Der Ausgabe wird ein # vorangestellt. Ein fairer Würfel:
Ein vorgespannter Chip mit den Nummern 1 bis 10 hat jeweils eine Wahrscheinlichkeit von 0,045; Diese 11-20 haben eine Wahrscheinlichkeit von 0,055 - 200 Würfen:
Wir haben nicht genügend Hinweise auf eine Verzerrung (p = 0,64).
Ein voreingenommener Würfel, 1000 Würfe:
Jetzt ist p <0,05 und wir sehen allmählich Hinweise auf eine Voreingenommenheit. Sie können ähnliche Simulationen verwenden, um den Grad der Verzerrung zu schätzen, den Sie bei einem bestimmten p-Pegel erkennen können, und die Anzahl der Würfe, die erforderlich sind, um ihn zu erkennen.
Wow, 2 andere Antworten, noch bevor ich mit dem Tippen fertig war.
quelle
Wollen Sie es von Hand oder in Excel machen?
Wenn Sie es in R machen wollen , können Sie es so machen:
Schritt 1: Wirf deinen Würfel (sagen wir mal) 100 Mal.
Schritt 2: Zählen Sie, wie oft Sie jede Ihrer Zahlen erhalten haben
Schritt 3: Setze sie in R wie folgt ein (schreibe die Anzahl der Würfelwürfe, die du hast, anstelle der Zahlen, die ich geschrieben habe):
Schritt 4: Führen Sie einfach diesen Befehl aus:
Wenn der P-Wert niedrig ist (z. B. Balg 0,05), ist Ihr Würfel nicht ausbalanciert.
Dieser Befehl simuliert einen ausgeglichenen Würfel (P = ~ .5):
Und dies simuliert einen unausgeglichenen Würfel:
(Es wird ungefähr P = ~ .005 sein)
Die eigentliche Frage ist nun, wie viele Würfel mit welcher Erkennungsstärke gewürfelt werden sollen. Wenn jemand das lösen möchte, wird er begrüßt ...
Update: Es gibt auch einen schönen Artikel zu diesem Thema finden Sie hier .
quelle
Erstens ist ein Bayesianer, wie @Glen_b sagte, eigentlich nicht daran interessiert, ob der Würfel genau fair ist oder nicht - es ist nicht so. Was ihn interessiert, ist, ob es nah genug ist , was "genug" im Kontext bedeutet, sagen wir, innerhalb von 5% der Fairness für jede Seite.
Wie auch immer, hier ist wie (mit R):
Holen Sie sich zunächst einige Daten. Wir würfeln 500 Mal.
(Wir beginnen mit einem fairen Würfel; in der Praxis würden diese Daten beobachtet.)
Lassen Sie uns abschließend unsere hintere Wahrscheinlichkeit abschätzen (nach Beobachtung der Daten), dass der Würfel in jeder Koordinate innerhalb von 0,05 fair liegt.
Das Ergebnis ist ungefähr 0.9486 auf meiner Maschine. (Eigentlich keine Überraschung. Wir haben doch mit einem fairen Würfel angefangen.)
Kurze Bemerkung: Es ist wahrscheinlich nicht sinnvoll, in diesem Beispiel einen nicht informativen Prior zu verwenden. Da es wahrscheinlich sogar eine Frage gibt, erscheint der Würfel zunächst ungefähr ausgeglichen. Daher ist es möglicherweise besser, einen Prior zu wählen, der in allen Koordinaten näher an 1/3 konzentriert ist. Darüber hätte unsere geschätzte hintere Wahrscheinlichkeit von "fast fair" einfach noch höher sein können.
quelle
Ein Chi-Quadrat-Anpassungstest zielt darauf ab, alle möglichen Arten von Abweichungen von der strengen Homogenität zu finden. Dies ist mit einem d4 oder einem d6 sinnvoll, aber mit einem d20 sind Sie wahrscheinlich mehr daran interessiert zu überprüfen, ob die Wahrscheinlichkeit, dass Sie unter jedem Ergebnis rollen (oder es möglicherweise übertreffen), in der Nähe des Sollwerts liegt.
Ich stelle fest, dass es einige Arten von Abweichungen von der Fairness gibt, die sich stark auf das auswirken, wofür Sie einen d20 verwenden, und andere Arten von Abweichungen, die überhaupt keine Rolle spielen, und der Chi-Quadrat-Test wird die Macht zwischen interessanteren aufteilen und weniger interessante Alternativen. Die Konsequenz ist, dass Sie eine große Anzahl von Rollen benötigen, um genügend Kraft zu haben, um selbst mäßige Abweichungen von der Fairness zu erkennen - weit mehr, als Sie jemals sitzen und generieren möchten.
(Tipp: Überlegen Sie sich ein paar Sätze ungleichmäßiger Wahrscheinlichkeiten für Ihren d20, die sich am stärksten auf das Ergebnis auswirken, für das Sie den d20 verwenden, und verwenden Sie Simulationen und Chi-Quadrat-Tests, um herauszufinden, welche Kraft Sie gegen sie haben verschiedene Rollenzahlen, damit Sie eine Vorstellung von der Anzahl der benötigten Rollen bekommen.)
Es gibt verschiedene Möglichkeiten, nach "interessanten" Abweichungen zu suchen (solche, die die typischen Verwendungszwecke eines d20 mit größerer Wahrscheinlichkeit wesentlich beeinflussen).
Meine Empfehlung ist, einen ECDF-Test (Kolmogorov-Smirnov / Anderson-Darling-Test) durchzuführen. Sie sollten jedoch die Konservativität, die sich aus der Diskretisierung der Verteilung ergibt, berücksichtigen, indem Sie zumindest das nominale Alpha-Niveau, aber auch das Niveau, anheben besser, indem Sie nur die Verteilung simulieren, um zu sehen, wie die Verteilung der Teststatistik für einen d20) aussieht.
Diese können noch jede Art von Abweichung aufnehmen, aber sie legen relativ mehr Gewicht auf die wichtigeren Arten von Abweichungen.
Ein noch leistungsfähigerer Ansatz besteht darin, eine Teststatistik zu erstellen, die speziell auf die für Sie wichtigsten Alternativen abgestimmt ist, jedoch etwas mehr Arbeit erfordert.
In dieser Antwort schlage ich eine grafische Methode zum Testen eines Stempels basierend auf der Größe der einzelnen Abweichungen vor. Wie beim Chi-Quadrat-Test ist dies sinnvoller für Würfel mit wenigen Seiten wie d4 oder d6.
quelle
Wenn Sie nur überprüfen möchten, wie oft jede Zahl angezeigt wird, ist ein Chi-Quadrat-Test geeignet. Angenommen, Sie würfeln N-mal. Sie würden erwarten, dass jeder Wert N / 20-mal auftritt. Alles, was ein Chi-Quadrat-Test macht, ist zu vergleichen, was Sie beobachtet haben, mit dem, was Sie erhalten. Wenn dieser Unterschied zu groß ist, deutet dies auf ein Problem hin.
Andere Tests
Wenn Sie sich zum Beispiel für andere Aspekte der Zufälligkeit interessieren, wenn Sie die folgenden Ergebnisse erzielen:
Dann ist diese Ausgabe, obwohl sie die richtige Nummer für jeden einzelnen Wert hat, eindeutig nicht zufällig. In diesem Fall werfen Sie einen Blick auf diese Frage . Dies ist wahrscheinlich nur für elektronische Würfel sinnvoll.
Chi-Quadrat-Test in R
In R wäre dies
quelle
Vielleicht sollte man sich nicht so sehr auf einen Satz Rollen konzentrieren.
Versuchen Sie, einen 6-seitigen Würfel 10 Mal zu werfen und wiederholen Sie den Vorgang 8 Mal.
Sie können überprüfen, ob die Summe für jede Wiederholung 10 ergibt.
Für jede Wiederholung (spaltenweise) können Sie die Anpassungsgüte mit dem Chi ^ 2-Test berechnen.
Je mehr Würfe du machst, desto weniger voreingenommen wirst du sein. Lassen Sie uns dies für eine große Anzahl tun.
quelle