Wie ist die Verteilung für verschiedene Polyederwürfel, die alle gleichzeitig gewürfelt werden?

15

Nehmen Sie die 5 platonischen Körper aus einem Satz Dungeons & Dragons-Würfel. Diese bestehen aus einem 4-seitigen, 6-seitigen (konventionellen), 8-seitigen, 12-seitigen und 20-seitigen Würfel. Alle beginnen bei der Nummer 1 und zählen bis zu ihrer Summe um 1 aufwärts.

Würfle sie alle auf einmal und nimm ihre Summe (Minimum 5, Maximum 50). Mach das mehrmals. Wie ist die Aufteilung?

Offensichtlich tendieren sie zum unteren Ende, da es mehr niedrigere Zahlen als höhere gibt. Aber wird es an jeder Grenze des einzelnen Würfels bemerkenswerte Wendepunkte geben?

[Edit: Anscheinend ist das, was offensichtlich schien, nicht. Laut einem der Kommentatoren liegt der Durchschnitt bei (5 + 50) /2=27,5. Ich habe das nicht erwartet. Ich würde immer noch gerne eine Grafik sehen.] [Edit2: Es ist sinnvoller zu sehen, dass die Verteilung von n Würfeln dieselbe ist wie bei jedem Würfel, der einzeln addiert wird.]

Marcos
quelle
1
Meinen Sie damit, wie verteilt sich die Summe der diskreten Uniformen ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung - Wiedereinsetzung von Monica
2
Eine Möglichkeit, dies zu untersuchen, ist die Simulation. In R: hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). Es tendiert eigentlich nicht zum unteren Ende; Von den möglichen Werten von 5 bis 50 beträgt der Durchschnitt 27,5, und die Verteilung ist (visuell) nicht weit vom Normalwert entfernt.
David Robinson
2
Mein D & D-Set hat eine D10 sowie die 5, die Sie erwähnen (plus einen Decader, den Sie
vermutlich nicht mit einbeziehen
1
Wolfram Alpha berechnet die Antwort genau . Hier ist die Wahrscheinlichkeitsfunktion , aus der Sie die Verteilung direkt ablesen können. Übrigens ist diese Frage ein Sonderfall, der unter stats.stackexchange.com/q/3614 und stats.stackexchange.com/questions/116792 gestellt und gründlich beantwortet wird .
whuber
2
@ AlecTeal: Einfach da, harter Kerl. Wenn Sie Ihre Nachforschungen anstellten, würden Sie feststellen, dass ich keinen Computer hatte, um die Simulation selbst auszuführen. Und das 100-fache Rollen schien für eine so einfache Frage nicht so effektiv zu sein.
Marcos

Antworten:

18

Ich würde es nicht algebraisch machen wollen, aber Sie können die PMF einfach genug berechnen (es ist nur Faltung, was in einer Tabelle wirklich einfach ist).

Ich habe diese in einer Tabelle berechnet *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Hier ist die Anzahl von Wegen, um jede Summe i zu erhalten ; p ( i ) ist die Wahrscheinlichkeit, mit der p ( in(i)ip(i) . Die wahrscheinlichsten Ergebnisse treten in weniger als 5% der Fälle auf.p(i)=n(i)/46080

Die y-Achse ist die Wahrscheinlichkeit, die als Prozentsatz ausgedrückt wird. Bildbeschreibung hier eingeben

* Die Methode, die ich verwendet habe, ähnelt der hier beschriebenen , obwohl sich die genauen Mechanismen für die Einrichtung ändern, wenn sich die Details der Benutzeroberfläche ändern (dieser Beitrag ist jetzt ungefähr 5 Jahre alt, obwohl ich ihn vor ungefähr einem Jahr aktualisiert habe). Und dieses Mal habe ich ein anderes Paket verwendet (diesmal in LibreOffice's Calc). Trotzdem ist das der Kern der Sache.

Glen_b - Setzen Sie Monica wieder ein
quelle
Erstaunlicherweise hatte ich überhaupt keine symmetrische Verteilung erwartet. Ich bin mir nicht sicher, warum meine Intuition so weit weg war.
Marcos
6
Die Summe der unabhängigen symmetrischen Zufallsvariablen ist ebenfalls symmetrisch verteilt.
Glen_b
Gute Regel. Wird das irgendwo veröffentlicht?
Marcos
3
Ja, aber ich war der Meinung, dass es zu trivial ist, eine Zeitschrift zu bekommen, um sie zu veröffentlichen. Es wäre nur eine Übung für einen Studenten. Sie können die Tatsache nutzen, dass die charakteristische Funktion einer Zufallsvariablen, die um den Ursprung symmetrisch ist, real und gerade ist (die Tatsache, die Sie auf der Wikipedia-Seite zur charakteristischen Funktion finden können ) - und ich denke, Sie brauchen die eine -to-one-Eigenschaft von cfs vs pmfs als auch, oder verwenden Sie die duale Beziehung, um festzustellen, dass ein
gerades
2
... und die Tatsache, dass ein Produkt aus geraden Funktionen gerade ist, aber es ist tatsächlich offensichtlich genug, wenn man direkt betrachtet, wie Faltung funktioniert - in einer Faltung von zwei symmetrischen Funktionen (in diesem Fall pmfs) für jeden Term in der Summe von produkte an einem ende befindet sich ein entsprechender begriff gleicher größe am anderen ende, der symmetrisch um die mitte platziert ist.
Glen_b
7

Also habe ich diesen Code gemacht:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

Das Ergebnis ist diese Handlung. Bildbeschreibung hier eingeben

Es sieht ganz nach Gauß aus. Ich denke, wir haben (wieder) eine Variation des zentralen Grenzwertsatzes gezeigt.

EngrStudent - Setzen Sie Monica wieder ein
quelle
2
Hmm, der niedrigste Wurf in Ihrer Simulation ist 6. Die Wahrscheinlichkeit, ihn zu würfeln (oder einen einzelnen Wurf, der die Identität des Würfels bewahrt), beträgt 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460800. Bei meinen Verfahren würde eine Stichprobengröße N mindestens das Doppelte (vielleicht das Vierfache) dieses Betrags (wie eine Nyquist-Grenze) erfordern, um Fehler in meiner Modellierung aufzudecken.
Marcos
Meine Erfahrung mit Nyquist sagt auch 4x das Minimum aus. ... erledigt. Wenn 2 Millionen nicht ausreichen, lassen Sie es mich wissen.
EngrStudent - wieder einzusetzen Monica
3
n
1
@EngrStudent: Übrigens, bestätigt Ihr Ergebnis nicht CLT?
Marcos
1
@theDoctor nein, es bestätigt die CLT aus einer Vielzahl von Gründen nicht
Glen_b -Reinstate Monica
7

Eine kleine Hilfe für Ihre Intuition:

Überlegen Sie zunächst, was passiert, wenn Sie eine zu allen Flächen eines Würfels hinzufügen, z. B. die d4. Anstelle von 1,2,3,4 zeigen die Gesichter nun 2,3,4,5.

Vergleicht man diese Situation mit der ursprünglichen, so ist leicht zu erkennen, dass die Gesamtsumme jetzt um eins höher ist als früher. Dies bedeutet, dass die Form der Verteilung unverändert bleibt und nur einen Schritt zur Seite bewegt wird.

Jetzt subtrahieren den Durchschnittswert jedes Würfels von jeder Seite dieses Würfels.

Dies gibt markierte Würfel

  • -32-121232
  • -52-32-121232,52
  • -72,-52,-32,-12,12,32,52,72

etc.

Jetzt sollte die Summe dieser Würfel immer noch die gleiche Form wie das Original haben, nur nach unten verschoben. Es sollte klar sein, dass diese Summe um Null symmetrisch ist. Daher ist auch die ursprüngliche Verteilung symmetrisch.

Stig Hemmer
quelle
4

Ich werde einen Ansatz zeigen, um dies algebraisch mit Hilfe von R zu tun. Angenommen, die verschiedenen Würfel haben Wahrscheinlichkeitsverteilungen, die durch Vektoren gegeben sind

P(X=ich)=p(ich)
wo X ist die Anzahl der Augen, die beim Würfeln zu sehen sind, und ich ist eine ganze Zahl im Bereich 0,1,,n. Die Wahrscheinlichkeit von zwei Augen liegt also beispielsweise in der dritten Vektorkomponente. Dann hat ein Standardwürfel eine durch den Vektor gegebene Verteilung(0,1/6,1/6,1/6,1/6,1/6,1/6). Die Wahrscheinlichkeitsfunktion (pgf) ist dann gegeben durchp(t)=06p(ich)tich. Lassen Sie den zweiten Würfel eine durch den Vektor gegebene Verteilung habenq(j) mit j im Bereich 0,1,,m. Dann die Verteilung der Augensumme auf zwei unabhängige Würfelwürfe, die sich aus dem Produkt der pgf ergibt,p(t)q(t). Das ausgeschriebene Produkt ergibt sich aus der Konvolution der Koeffizientenfolgen, also aus der R-Funktion convolve (). Lassen Sie uns dies durch zwei Würfe mit Standardwürfeln testen:
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

und Sie können überprüfen, ob dies korrekt ist (durch manuelle Berechnung). Nun zur eigentlichen Frage, fünf Würfel mit 4,6,8,12,20 Seiten. Ich werde die Berechnung unter der Annahme einheitlicher Probs für jeden Würfel durchführen. Dann:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

Die Handlung ist unten dargestellt:

Bildbeschreibung hier eingeben

Jetzt können Sie diese exakte Lösung mit Simulationen vergleichen.

kjetil b halvorsen
quelle
1

Der zentrale Grenzwertsatz beantwortet Ihre Frage. Obwohl seine Details und sein Beweis (und dieser Wikipedia-Artikel) etwas hirnrissig sind, ist das Wesentliche einfach. Per Wikipedia heißt es, dass

Die Summe mehrerer unabhängiger und identisch verteilter Zufallsvariablen mit endlichen Abweichungen tendiert zu einer Normalverteilung, wenn die Anzahl der Variablen zunimmt.

Skizze eines Beweises für Ihren Fall:

Wenn Sie sagen, dass Sie alle Würfel auf einmal werfen, ist jeder Würfelwurf eine Zufallsvariable.

Auf Ihren Würfeln sind endliche Zahlen aufgedruckt. Die Summe ihrer Werte hat daher eine endliche Varianz.

Jedes Mal, wenn Sie alle Würfel werfen, ist die Wahrscheinlichkeitsverteilung des Ergebnisses gleich. (Die Würfel wechseln nicht zwischen den Würfen.)

Wenn Sie fair würfeln, ist das Ergebnis bei jedem Wurf unabhängig. (Vorherige Rollen wirken sich nicht auf zukünftige Rollen aus.)

Unabhängig? Prüfen. Identisch verteilt? Prüfen. Endliche Varianz? Prüfen. Daher tendiert die Summe zu einer Normalverteilung.

Es wäre nicht einmal wichtig, wenn die Verteilung für einen Wurf aller Würfel zum unteren Ende hin schief wäre. Es wäre mir egal, ob diese Verteilung Spitzen enthält. Die ganze Summierung glättet es und macht es zu einem symmetrischen Gaußschen. Sie müssen nicht einmal Algebra oder Simulationen durchführen, um es zu zeigen! Das ist die überraschende Einsicht des CLT.

Paul Cantrell
quelle
3
Während die CLT relevant ist und wie die anderen Posts zeigen, die Verteilungen grob gaußartig aussehen, haben wir es nur mit der Summe von 5 unabhängigen, nicht identischen Verteilungen zu tun . Punkt 1) 5 ist also nicht groß genug, um einen Satz aufzustellen, der "im Unendlichen" gilt. Punkt 2) Sie können das Vanille-CLt nicht verwenden, weil die Dinge, die Sie summieren, nicht iid sind. Sie brauchen das Lyapunov CLT, denke ich.
Peter
2
Sie brauchen den zentralen Grenzwertsatz nicht zu verwenden, um zu sagen, dass die Summe einiger unabhängiger Zufallsvariablen mit symmetrischen Verteilungen um ihre jeweiligen Zentren eine symmetrische Verteilung um die Summe der Zentren hat.
Henry
@ Peter: Du vermisst die Struktur meines Beweises. Die OP sagt „roll sie alle auf einmal.“ Ich jede Rolle nehme alle die Würfel als eine Zufallsvariable. Diese Zufallsvariablen haben eine identische Verteilung. Lyapunov ist nicht nötig. Außerdem sagt das OP "mach das mehrmals", was ich als "im Limit" bezeichne, so dass dein Punkt # 1 nicht gültig ist. Wir addieren hier nicht nur einen Würfelwurf mit 5 Würfeln.
Paul Cantrell
2
@PaulCantrell Jeder Wurf aller Würfel ist die Summe von fünf unabhängigen, nicht identisch verteilten Variablen. Das OP fragt nach der Verteilung dieser Summe. Sie können viele Würfe von den 5 Würfeln machen, aber das ist nur eine Stichprobe aus der fraglichen Verteilung, niemand summiert diese Stichproben.
Peter
1
@PaulCantrell Ich denke, es hängt davon ab, wie Sie "Tun Sie dies mehrmals" interpretieren. Tun Sie dies mehrmals, und sie addieren sich erneut (um einen einzelnen Wert zu erhalten), oder tun Sie dies mehrmals und sehen Sie sich das Histogramm dieser Stichproben an (um mehrere Werte zu erhalten). Ich habe die letztere Interpretation genommen.
Peter