Ich werfe einen fairen Würfel. Immer wenn ich eine 1, 2 oder 3 bekomme, schreibe ich eine '1' auf; wenn ich eine 4 bekomme, schreibe ich eine '2' auf; Immer wenn ich eine 5 oder eine 6 bekomme, schreibe ich eine '3' auf.
Sei die Gesamtzahl der Würfe, die ich brauche, damit das Produkt aller Zahlen, die ich notiert habe, . Ich möchte \ P (N \ geq 25) berechnen (oder approximieren) , und eine Approximation kann als Funktion der Normalverteilung angegeben werden.
Erstens weiß ich, dass weil . Nun sei , und die Häufigkeit, mit der ich eine 1, 2 bzw. 3 aufgeschrieben habe. Dann:
Was ich berechnen möchte, ist:
Wie berechne ich das?
--BEARBEITEN:
Daher wurde vorgeschlagen, die Bedingung durch Folgendes zu ersetzen:
Dabei ist , , und .
Das sieht lösbarer aus! Ich habe leider noch keine Ahnung, wie ich es lösen soll.
quelle
Antworten:
Die vorliegende Frage ist ein spezieller Fall, in dem es sich um eine Größe handelt, die eine lineare Funktion einer multinomialen Zufallsvariablen ist. Es ist möglich, Ihr Problem genau zu lösen, indem Sie die Multinomialkombinationen aufzählen, die die erforderliche Ungleichung erfüllen, und die Verteilung über diesen Bereich summieren. In dem Fall, in dem groß ist, kann dies rechnerisch unmöglich werden. In diesem Fall ist es möglich, eine ungefähre Verteilung unter Verwendung der normalen Annäherung an das Multinom zu erhalten. Eine verallgemeinerte Version dieser Annäherung wird unten gezeigt, und diese wird dann auf Ihr spezifisches Beispiel angewendet.N
Allgemeines Approximationsproblem: Angenommen, wir haben eine Folge austauschbarer Zufallsvariablen mit dem Bereich . Für jedes wir den Zählvektor , der die Anzahl von zählt Vorkommen jedes Ergebnisses in den ersten Werten der Sequenz. Da die zugrunde liegende Sequenz austauschbar ist, wird der Zählvektor wie folgt verteilt:1,2,...,m n∈N X≡X(n)≡(X1,X2,...,Xm) n
Nehmen wir nun an, wir haben einen Vektor nicht negativer Gewichte und verwenden diese Gewichte, um die lineare Funktion zu definieren:w=(w1,w2,...,wm)
Da die Gewichte nicht negativ sind, nimmt diese neue Menge in . Wir definieren dann die Zahl , dies ist die kleinste Anzahl von Beobachtungen, die erforderlich sind, um einen bestimmten Mindestwert für unsere lineare Funktion zu erhalten. Wir wollen die Verteilung von für den Fall approximieren, dass dieser Wert (stochastisch) groß ist.n N(a)≡min{n∈N|A(n)⩾a} N(a)
Lösung des allgemeinen Approximationsproblems: Erstens stellen wir fest, dass in nicht abnimmt (was gilt, weil wir angenommen haben, dass alle Gewichte nicht negativ sind), haben wir:A(n) n
Daher wird die Verteilung von ist direkt mit der Verteilung von verwandtem . Unter der Annahme, dass die erstere Größe groß ist, können wir die Verteilung der letzteren approximieren, indem wir den diskreten Zufallsvektor durch eine kontinuierliche Approximation aus der multivariaten Normalverteilung ersetzen . Dies führt zu einer normalen Näherung für die lineare Größe , und wir können die Momente dieser Größe direkt berechnen. Dazu verwenden wir die Tatsache, dass , und für . Mit etwas grundlegender Algebra ergibt dies:N A X A(n) E(Xi)=nθi V(Xi)=nθi(1−θi) C(Xi,Xj)=−nθiθj i≠j
Wenn wir die normale Annäherung an das Multinomial nehmen, erhalten wir nun die ungefähre Verteilung . Die Anwendung dieser Näherung ergibt:A(n) ~ N(nμ,nμ(1−μ))
(Das Symbol ist die Standardnotation für die Standardnormalverteilungsfunktion.) Mit dieser Näherung können Wahrscheinlichkeiten für die Größe für einen bestimmten Wert von . Dies ist eine grundlegende Näherung, bei der nicht versucht wurde, eine Kontinuitätskorrektur für die Werte der zugrunde liegenden multinomialen Zählwerte vorzunehmen. Es wird erhalten, indem eine normale Näherung unter Verwendung der gleichen ersten beiden zentralen Momente wie die exakte lineare Funktion vorgenommen wird.Φ N(a) a
Anwendung auf Ihr Problem: In Ihrem Problem haben Sie Wahrscheinlichkeiten , Gewichte und Grenzwert . Sie haben also (auf sechs Dezimalstellen gerundet) . Unter Anwendung der obigen Näherung (Rundung auf sechs Dezimalstellen):θ=(12,16,13) w=(0,ln2,ln3) a=ln100000 μ=16ln2+13ln3=0.481729
Durch Anwendung der exakten Multinomialverteilung, die über alle Kombinationen summiert wird, die die Anforderung erfüllen , kann gezeigt werden, dass das genaue Ergebnis . Wir können also sehen, dass die Annäherung im vorliegenden Fall der genauen Antwort ziemlich nahe kommt.P(A(24)<a) P(N(a)⩾25)=0.483500
Hoffentlich gibt Ihnen diese Antwort eine Antwort auf Ihre spezifische Frage und stellt sie gleichzeitig in einen allgemeineren Rahmen probabilistischer Ergebnisse, die für lineare Funktionen multinomialer Zufallsvektoren gelten. Mit der vorliegenden Methode sollten Sie ungefähre Lösungen für Probleme des allgemeinen Typs erhalten, mit denen Sie konfrontiert sind, und die Variation der spezifischen Zahlen in Ihrem Beispiel berücksichtigen.
quelle
Machen wir eine normale Annäherung.
Lassen Sie uns zunächst Ihr Problem vollständig in Protokollen umformulieren. Sie beginnen bei 0 zum Zeitpunkt t = 0. Dann fügen Sie bei jedem Zeitschritt Folgendes hinzu:
0 mit der Wahrscheinlichkeit 1/2
Sie stoppen diesen Prozess, wenn Ihre Summe überschreitet. An diesem Punkt sehen Sie, wie viele Würfe Sie ausgeführt haben. Die Anzahl der Würfe, die Sie benötigt haben, um diesen Punkt zu erreichen, ist ^log(105) N
Mein Rechner sagt mir, dass der Mittelwert Ihrer Inkremente: und die Varianz beträgt . Als Referenz liegt der Endpunkt bei sodass wir ihn in ungefähr 24 Schritten erreichen≈0.48 ≈0.25 ≈11.51
Unter der Bedingung, dass wir 25 Schritte ausgeführt haben, ist die Verteilung der Summe ungefähr ein Gaußscher Wert, der bei 12,0 zentriert ist und eine Varianz von 6,25 aufweist. Dies gibt uns eine grobe Gaußsche Näherung vonp(N≥25)≈0.5
Sie müssten sich die Kumulanten der Summe bei N = 25 ansehen, um zu wissen, ob die Gaußsche Näherung in Ordnung ist oder nicht. Da die Inkremente nicht symmetrisch sind, ist die ungefähre möglicherweise nicht die beste
quelle