Ich bin in einem Computerspiel auf diese Distribution gestoßen und wollte mehr über ihr Verhalten erfahren. Es ergibt sich aus der Entscheidung, ob ein bestimmtes Ereignis nach einer bestimmten Anzahl von Spieleraktionen eintreten soll. Die Details darüber hinaus sind nicht relevant. Es scheint auf andere Situationen anwendbar zu sein, und ich fand es interessant, weil es einfach zu berechnen ist und einen langen Schwanz erzeugt.
Bei jedem Schritt erzeugt das Spiel eine einheitliche Zufallszahl . Wenn , wird das Ereignis ausgelöst. Nachdem das Ereignis einmal aufgetreten ist, setzt das Spiel und durchläuft die Sequenz erneut. Ich bin nur an einem Auftreten des Ereignisses für dieses Problem interessiert, da dies die Verteilung darstellt, die das Spiel verwendet. (Außerdem können alle Fragen zu mehreren Vorkommen mit einem einzigen Vorkommensmodell beantwortet werden.)
Die Haupt- "Anomalie" hierbei ist, dass der Wahrscheinlichkeitsparameter in dieser Verteilung mit der Zeit zunimmt oder anders ausgedrückt, der Schwellenwert mit der Zeit ansteigt. Im Beispiel ändert es sich linear, aber ich nehme an, dass andere Regeln gelten könnten. Nach Schritten oder Aktionen des Benutzers
für eine Konstante . An einem bestimmten Punkt n max erhalten wir p ( n max ) ≥ 1 . Das Ereignis tritt einfach garantiert in diesem Schritt auf.
Das konnte ich feststellen
und F ( n ) = p ( n ) + F ( n - 1 ) [ 1 - p ( n ) ] für PMF f ( n ) und CDF F ( n ) . Kurz gesagt, die Wahrscheinlichkeit, dass das Ereignis auf dem n wird
Hier ist eine Handlung von unserem Freund Monte Carlo zum Spaß mit . Der Median beträgt 21 und der Durchschnitt 22.
Dies entspricht im Großen und Ganzen einer Differenzgleichung erster Ordnung aus der digitalen Signalverarbeitung, die mein Hintergrund ist, und so fand ich das ziemlich neu. Ich bin auch fasziniert von der Vorstellung, dass nach einer beliebigen Formel variieren könnte.
Meine Fragen:
- Wie heißt diese Distribution, wenn sie eine hat?
- Gibt es eine Möglichkeit, einen Ausdruck für ohne Bezugnahme auf F ( n ) abzuleiten ?
- Gibt es andere Beispiele für solche diskreten rekursiven Verteilungen?
Bearbeitet Klären Prozess zur Zufallszahlengenerierung.
Antworten:
In gewissem Sinne haben Sie alle nichtnegativen Verteilungen mit ganzzahligen Werten charakterisiert .
Lassen Sie uns die Beschreibung des zufälligen Prozesses für einen Moment beiseite legen und uns auf die Rekursionen in der Frage konzentrieren.
Wenn , dann mit Sicherheit F n = p n + ( 1 - P n ) F n - 1 . Wenn wir diese zweite Rekursion in Bezug auf die Überlebensfunktion S n = 1 - F n = P ( T umschreibenfn=pn(1−Fn−1) Fn=pn+(1−pn)Fn−1 (wobei T die Verteilung F hatSn=1−Fn=P(T>n) T F ) bekommen wir etwas sehr suggestives und leicht zu handhabendes. Es ist klar, dass
Und so
S n = n Π k = 0 ( 1 - P k )
Genauer,
Somit ist die in der Frage geschriebene Rekursion ganz allgemein : Jede nichtnegative ganzzahlige Verteilung hat eine entsprechende Folge(pn) die Werte annimmt, ist .[0,1]
Das Gegenteil ist jedoch nicht der Fall; Das heißt, es gibt Sequenzen mit Werten in [ 0 , 1 ] , die keiner gültigen Verteilung entsprechen. (Betrachten Sie insbesondere 0 < p n < 1 für alle n ≤ N und p n = 0 für n > N. )(pn) [0,1] 0<pn<1 n≤N pn=0 n>N
Aber warte, es gibt noch mehr!
Wir haben einen Zusammenhang mit der Überlebensanalyse angedeutet, und es lohnt sich, dies etwas genauer zu untersuchen. In der klassischen Überlebensanalyse mit einer absolut kontinuierlichen Verteilung und entsprechender Dichte f ist die Hazard-Funktion definiert als h ( t ) = f ( t )F f
Die kumulative Gefahr ist dann und eine einfache Analyse von Derivaten zeigen, dass S ( t ) = exp ( - Λ ( t ) ) = exp ( - ∫ t 0 h ( s )Λ(t)=∫t0h(s)ds
Daraus können wir sofort eine Charakterisierung einer zulässigen Gefahrenfunktion geben: Es ist jede messbare Funktion h, so dass h ( t ) ≥ 0 für alle t und
∫ t 0 h ( s ) ist.
Wir erhalten eine ähnliche Rekursion für die Überlebensfunktion wie oben, indem wir feststellen, dass für S ( t ) = e - ∫ t t 0t>t0
Beachten Sie insbesondere, dass wir als stückweise konstant wählen könnten, wobei jedes Stück die Breite 1 hat und das Integral gegen unendlich konvergiert. Dies würde eine Überlebensfunktion S (h(t) S(t)
Zurück zum diskreten Gehäuse
quelle
Im Fallep ( n ) = p < 1 Wir haben einige bekannte Eigenschaften. Wir können die Wiederholungsbeziehung lösen
has the solution
The more general case ofp(n) can probably not be computed in closed form, and thus likely does not have a known distribution.
Other cases:
quelle