Hier ist die Frage:
Sie würfeln iterativ einen fairen 6-seitigen Würfel, bis die Summe der Würfelwürfe größer oder gleich M ist. Was ist der Mittelwert und die Standardabweichung der Summe minus M, wenn M = 300?
Sollte ich einen Code schreiben, um diese Art von Fragen zu beantworten?
Bitte geben Sie mir einige Hinweise dazu. Vielen Dank!
[self-study]
Tag hinzu und lies das Wiki . Dann sagen Sie uns, was Sie bisher verstanden haben, was Sie versucht haben und wo Sie stecken bleiben. Wir geben Ihnen Tipps, wie Sie sich lösen können.Antworten:
Sie können sicherlich Code verwenden, aber ich würde nicht simulieren.
Ich werde den "Minus M" Teil ignorieren (das kannst du am Ende leicht genug machen).
Sie können die Wahrscheinlichkeiten sehr einfach rekursiv berechnen, aber die tatsächliche Antwort (mit einem sehr hohen Grad an Genauigkeit) kann aus einfachen Überlegungen berechnet werden.
Lassen Sie die RollenX.1, X.2, . . . . Sei S.t= ∑ti = 1X.ich .
Seiτ der kleinste Index, wobei S.τ≥ M. .
ähnlich
Gleichungen, die der ersten oben ähnlich sind, könnten dann (zumindest im Prinzip) zurückgeführt werden, bis Sie eine der Anfangsbedingungen treffen, um eine algebraische Beziehung zwischen den Anfangsbedingungen und den von uns gewünschten Wahrscheinlichkeiten zu erhalten (was mühsam und nicht besonders aufschlussreich wäre). , oder Sie können die entsprechenden Vorwärtsgleichungen konstruieren und sie unter den Anfangsbedingungen vorwärts ausführen, was numerisch einfach zu bewerkstelligen ist (und auf diese Weise habe ich meine Antwort überprüft). All das können wir jedoch vermeiden.
Die Wahrscheinlichkeiten der Punkte sind gewichtete Durchschnittswerte früherer Wahrscheinlichkeiten. Diese glätten (geometrisch schnell) jede Abweichung der Wahrscheinlichkeit von der anfänglichen Verteilung (alle Wahrscheinlichkeit am Punkt Null im Fall unseres Problems). Das
In einer Näherung (eine sehr genaue) können wir sagen, dass bis M - 1 zum Zeitpunkt τ - 1 (sehr nahe daran) fast gleich wahrscheinlich sein sollten , und so können wir aus dem Obigen aufschreiben, dass die Wahrscheinlichkeiten werden sehr nahe daran sein, in einfachen Verhältnissen zu sein, und da sie normalisiert werden müssen, können wir einfach Wahrscheinlichkeiten aufschreiben.M−6 M−1 τ−1
Das heißt, wir können sehen, dass, wenn die Wahrscheinlichkeiten für den Start von bis M - 1 genau gleich wären , es 6 gleich wahrscheinliche Wege gibt, um zu M zu gelangen , 5 um zu M + 1 zu gelangen und so weiter bis hinunter 1 Weg zu M + 5 .M−6 M−1 M M+1 M+5
Das heißt, die Wahrscheinlichkeiten liegen im Verhältnis 6: 5: 4: 3: 2: 1 und summieren sich zu 1, sodass sie trivial aufzuschreiben sind.
Die genaue Berechnung (bis zu akkumulierten numerischen Rundungsfehlern) durch Vorwärtslaufen der Wahrscheinlichkeitsrekursionen von Null (ich habe es in R getan) ergibt Unterschiede in der Größenordnung von≈
.Machine$double.eps
( auf meiner Maschine) gegenüber der obigen Näherung (dh einfach) Wenn Sie in die oben genannten Richtungen argumentieren, erhalten Sie effektiv genaue Antworten, da sie den aus der Rekursion berechneten Antworten so nahe kommen, wie wir es von den genauen Antworten erwarten würden.2.22e-16
Hier ist mein Code dafür (das meiste davon initialisiert nur die Variablen, die Arbeit ist alles in einer Zeile). Der Code beginnt nach dem ersten Wurf (um mir das Einfügen einer Zelle 0 zu ersparen, was ein kleines Ärgernis in R ist); Bei jedem Schritt nimmt es die niedrigste Zelle, die besetzt sein könnte, und bewegt sich durch einen Würfelwurf vorwärts (verteilt die Wahrscheinlichkeit dieser Zelle auf die nächsten 6 Zellen):
(Wir könnten
rollapply
(vonzoo
) verwenden, um dies effizienter zu machen - oder eine Reihe anderer solcher Funktionen -, aber es wird einfacher zu übersetzen sein, wenn ich es explizit halte.)Beachten Sie, dass dies
d6
eine diskrete Wahrscheinlichkeitsfunktion über 1 bis 6 ist, sodass der Code in der Schleife in der letzten Zeile laufende gewichtete Durchschnittswerte früherer Werte erstellt. Es ist diese Beziehung, die die Wahrscheinlichkeiten glättet (bis zu den letzten Werten, an denen wir interessiert sind).Hier sind also die ersten 50 ungeraden Werte (die ersten 25 mit Kreisen markierten Werte). Bei jedem repräsentiert der Wert auf der y-Achse die Wahrscheinlichkeit, die sich in der hintersten Zelle angesammelt hat, bevor wir sie in die nächsten 6 Zellen vorwärts gerollt haben.t
Wie Sie sehen, glättet es sich ziemlich schnell (auf , der Kehrwert des Mittelwerts der Anzahl der Schritte, die jeder Würfelwurf benötigt) und bleibt konstant.1/μ
Und sobald wir treffen , fallen diese Wahrscheinlichkeiten weg (weil wir die Wahrscheinlichkeit für Werte bei M und darüber hinaus nicht der Reihe nach vorwärts setzen).M M
Die Idee, dass die Werte bei bis M - 6 gleich wahrscheinlich sein sollten, da die Schwankungen von den Anfangsbedingungen geglättet werden, ist eindeutig der Fall.M−1 M−6
Da die Argumentation von nichts anderem abhängt, als dass groß genug ist, dass die Anfangsbedingungen auswaschen, so dass M - 1 bis M - 6 zum Zeitpunkt τ - 1 nahezu gleich wahrscheinlich sind , ist die Verteilung für jedes große im Wesentlichen gleich M , wie Henry in den Kommentaren vorgeschlagen hat.M M−1 M−6 τ−1 M
Rückblickend würde Henrys Hinweis (der auch in Ihrer Frage steht), mit der Summe minus M zu arbeiten, ein wenig Mühe sparen, aber das Argument würde sehr ähnlichen Linien folgen. Sie können fortfahren, indem Sie und ähnliche Gleichungen schreiben, die R 0 mit den vorhergehenden Werten in Beziehung setzen, und so weiter.Rt=St−M R0
Aus der Wahrscheinlichkeitsverteilung sind dann der Mittelwert und die Varianz der Wahrscheinlichkeiten einfach.
Edit: Ich nehme an, ich sollte den asymptotischen Mittelwert und die Standardabweichung der Endposition minus angeben :M
Der asymptotische mittlere Überschuss beträgt und die Standardabweichung ist2 √53 . BeiM=300 istdies viel genauer, als Sie wahrscheinlich interessieren.25√3 M=300
quelle
At this point we could argue heuristically that, to a very good approximation for all but the smallestM ,
A rigorous way to demonstrate this considers howEi could occur. Either Ei−1 occurs and the subsequent roll was a 1 ; or Ei−2 occurs and the subsequent roll was a 2 ; or ... or Ei−6 occurs and the subsequent roll was a 6 . This is an exhaustive partition of the possibilities, whence
The initial values of this sequence are
This plot ofPr(Ei) against i shows how rapidly the chances settle down to a constant 2/7 , shown by the horizontal dotted line.
There is a standard theory of such recursive sequences. It can be developed by means of generating functions, Markov chains, or even algebraic manipulation. The general result is that a closed-form formula forPr(Ei) exists. It will be a linear combination of a constant and the ith powers of roots of the polynomial
The largest magnitude of these roots is approximatelyexp(−0.314368) . In a double precision floating point representation, exp(−36.05) is essentially zero. Therefore, for i≫−36.05/−0.314368=115 , we may completely ignore all but the constant. This constant is 2/7 .
Consequently, forM=300≫115 , for all practical purposes we may take EM+k−j=2/7 , whence
Computing the mean and variance of this distribution is straightforward and easy.
Here is anM+5=305 , tabulates the values of X300−300 , and applies a χ2 test to assess whether the results are consistent with the foregoing. The p-value (in this case) of 0.1367 is large enough to indicate they are consistent.
R
simulation to confirm these conclusions. It generates almost 100,000 sequences throughquelle