Sei unabhängige Zufallsvariablen, die Werte oder mit einer Wahrscheinlichkeit von jeweils 0,5 . Betrachten Sie die Summe . Ich möchte die Wahrscheinlichkeit nach oben begrenzen . Die beste Grenze, die ich ist wobei c eine universelle Konstante ist. Dies wird erreicht, indem die Wahrscheinlichkeit Pr (| x_1 + \ Punkte + x_n | <\ sqrt {t}) und Pr (| y_1 + \ Punkte + y_n | <\ sqrt {t}) durch Anwendung einfacher Chernoff-Grenzen niedriger begrenzt werden. Kann ich hoffen, etwas zu bekommen, das wesentlich besser ist als diese Grenze? Für den Anfang kann ich wenigstens bekommen . Wenn ich subgaußsche Schwänze bekommen kann, wäre das wahrscheinlich das Beste, aber können wir das erwarten (ich denke nicht, aber ich kann mir kein Argument vorstellen)?
quelle
Antworten:
Die algebraische Beziehung
zeigt als Produkt zweier unabhängiger Summen. Da und unabhängige Bernoulli -Variaten sind, ist eine Binomialvariable , die wurde verdoppelt und verschoben. Daher ist sein Mittelwert und seine Varianz ist . In ähnlicher Weise hat einen Mittelwert von und eine Varianz von . Lassen Sie uns sie jetzt durch Definieren standardisierenS (xi+1)/2 (yj+1)/2 (1/2) X=∑ai=1xi (a,1/2) 0 a Y=∑bj=1yj 0 b
woher
Um ein hohes (und quantifizierbares) Grad an Genauigkeit, wie wächst großer nähert sich die Standardnormalverteilung. Lassen Sie uns daher als mal das Produkt zweier Standardnormalen approximieren.a Xa S ab−−√
Der nächste Schritt ist, das zu bemerken
ist ein Vielfaches der Differenz der Quadrate der unabhängigen Standard - Normalvariablen und . Die Verteilung von kann analytisch berechnet werden (durch Invertieren der charakteristischen Funktion ): Sein PDF ist proportional zur Bessel-Funktion der Ordnung Null, . Da diese Funktion exponentielle Schwänze hat, schließen wir sofort, dass es für großes und und festes keine bessere Annäherung an als in der Frage angegeben.U V Zab K0(|z|)/π a b t Pra,b(S>t)
Es bleibt Raum für Verbesserungen, wenn eines (mindestens) von und nicht groß ist oder an Punkten im Schwanz von nahe . Direkte Berechnungen der Verteilung von zeigen eine gekrümmte Verjüngung der Schwanzwahrscheinlichkeiten an Punkten, die viel größer als , ungefähr jenseits von . Diese logarithmisch linearen Diagramme der CDF von für verschiedene Werte von (in den Titeln angegeben) und (ungefähr in den gleichen Werten wie , unterschieden durch Farbe in jedem Diagramm) zeigen, was los ist. Als Referenz dient der Graph der Begrenzunga b S ±ab S ab−−√ abmax(a,b)−−−−−−−−−−√ S a b a K0 Verteilung wird in schwarz angezeigt. (Da um symmetrisch ist , ist , so dass es ausreicht, den negativen Schwanz zu betrachten.)S 0 Pr(S>t)=Pr(−S<−t)
Wenn größer wird, wächst die CDF näher an der Referenzlinie.b
Die Charakterisierung und Quantifizierung dieser Krümmung würde eine genauere Analyse der normalen Annäherung an Binomialvariablen erfordern.
Die Qualität der Bessel-Funktionsnäherung wird in diesen vergrößerten Bereichen (in der oberen rechten Ecke jedes Diagramms) klarer. Wir sind schon ziemlich weit draußen. Obwohl die logarithmische vertikale Skala erhebliche Unterschiede verbergen kann, eindeutig durch die Zeit erreicht die Annäherung ist gut für .a 500 |S|<ab√
R-Code zur Berechnung der Verteilung vonS
Die Ausführung des folgenden Vorgangs dauert einige Sekunden. (Es werden mehrere Millionen Wahrscheinlichkeiten für 36 Kombinationen von und berechnet .) Lassen Sie auf langsameren Maschinen die größeren ein oder zwei Werte von und weg und erhöhen Sie die untere Plotgrenze von auf etwa .a b 10−300 10−160
a
b
quelle
1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y])
. Es wäre interessant zu sehen, wie: (a) die Grenze des OP funktioniert und (b) Ihre normale Näherung für den oben betrachteten Fall funktioniert, dh abgeleitet unter Verwendung der exakten diskreten pmf-Lösung.Kommentar: Ich habe den Titel bearbeitet, um besser zu reflektieren, welche Art von Wohnmobilen in der Frage berücksichtigt werden. Jeder kann sie erneut bearbeiten.
Motivation: Ich denke, es besteht keine Notwendigkeit, sich mit einer Obergrenze zufrieden zu geben, wenn wir die Verteilung vonableiten können . ( UPDATE : Wir können Whubers Kommentare und Antworten nicht sehen).|Sab|
Bezeichne . Es ist leicht zu überprüfen, ob die gleiche Verteilung wie und . Die Momenterzeugungsfunktion istZk=XiYj,k=1,...,ab Z X Y
Darüber hinaus sind die paarweise unabhängig: Die Variable (Indizes können natürlich beliebig sein) unterstützt mit entsprechenden Wahrscheinlichkeiten . Seine Momenterzeugungsfunktion istZ W=Z1+Z2 {−2,0,2} {1/4,1/2,1/4}
Ich werde versuchen zu vermuten, dass die vollständige Unabhängigkeit wie folgt gilt (ist es für die weiseren offensichtlich?): Bezeichnen Sie für diesen Teil . Dann ist nach der KettenregelZij=XiYj
Durch paarweise Unabhängigkeit haben wir . Betrachten Sie . und sind unabhängig von also haben wir die zweite Gleichheit durch paarweise Unabhängigkeit. Aber das impliziert dasP[Z12∣Z11]=P[Z12]
P[Z13,Z12∣Z11] Z13 Z12 Z11
Usw. (glaube ich). ( UPDATE : Ich denke falsch . Unabhängigkeit gilt wahrscheinlich für jedes Triplett, aber nicht für den gesamten Haufen. Was folgt, ist nur die Ableitung der Verteilung eines einfachen zufälligen Spaziergangs und keine korrekte Antwort auf die Frage - siehe Wolfies und Whubers Antworten).
Wenn die volle Unabhängigkeit tatsächlich zutrifft, haben wir die Aufgabe, die Verteilung einer Summe der dichotomen rvs
das sieht aus wie ein einfacher zufälliger Spaziergang , allerdings ohne die klare Interpretation des letzteren als Sequenz.
Wenn die Unterstützung von die geraden ganzen Zahlen in einschließlich Null, während wenn die Unterstützung von die ungeraden ganzen Zahlen in ohne Null.ab=even S [−ab,...,ab] ab=odd S [−ab,...,ab]
Wir behandeln den Fall von . Bezeichne als die Anzahl der , die den Wert . Dann wird die Unterstützung der geschrieben werden . Für jeden gegebenen , wir einen eindeutigen Wert für erhalten . Darüber hinaus sind aufgrund symmetrischer Wahrscheinlichkeiten und Unabhängigkeit (oder nur Austauschbarkeit?) Alle möglichen gemeinsamen Realisierungen der Variablen wahrscheinlich. Also zählen wir und stellen fest, dass die Wahrscheinlichkeitsmassenfunktion von ist,ab=odd
m Z −1 S S∈{ab−2m;m∈Z+∪{0};m≤ab} m S Z {Z1=z1,...,Zab=zab} S
Definieren und ungerade Anzahl von Konstruktion und das typische Element der Unterstützung von , haben wirs≡ab−2m S
Wechseln zu, da, wenn , die Verteilung von um Null symmetrisch ist, ohne die Wahrscheinlichkeitsmasse Null zuzuweisen, und somit die Verteilung vonwird durch "Falten" des Dichtediagramms um die vertikale Achse erhalten, wodurch die Wahrscheinlichkeiten für positive Werte im Wesentlichen verdoppelt werden.|S| ab=odd S |S|
Dann ist die Verteilungsfunktion
Daher erhalten wir für jedes reelle , , die erforderliche Wahrscheinlichkeitt 1≤t<ab
Beachten Sie, dass die Angabe garantiert, dass die Summe nur bis zu den Werten läuft, die in der Unterstützung von- Wenn wir zum Beispiel , läuft immer noch bis , da es zwangsläufig ungerade ist, zusätzlich zu einer ganzen Zahl.i=odd |S| t=10.5 i 9
quelle
Keine Antwort, sondern ein Kommentar zu Alecos 'interessanter Antwort, der zu lang ist, um in ein Kommentarfeld zu passen.
Sei unabhängige Rademacher-Zufallsvariablen und sei unabhängige Rademacher-Zufallsvariable. Alecos bemerkt, dass:(X1,...,Xa) (Y1,...,Yb)
"... sieht aus wie ein einfacher zufälliger Spaziergang ". Wenn es wie ein einfacher zufälliger Spaziergang wäre, wäre die Verteilung von symmetrisch "glockenförmig unimodal" um 0.S
Um zu veranschaulichen, dass es sich nicht um einen einfachen zufälligen Spaziergang handelt, finden Sie hier einen kurzen Monte-Carlo-Vergleich von:
Offensichtlich ist kein einfacher zufälliger Spaziergang; Beachten Sie auch, dass S nicht auf alle geraden (oder ungeraden) ganzen Zahlen verteilt ist.S
Monte Carlo
Hier ist der Code (in Mathematica ), der verwendet wird, um eine einzelne Iteration der Summe zu erzeugen , wenn und :S a b
Dann können 500.000 solcher Pfade, beispielsweise wenn und , erzeugt werden mit:a=5 b=7
Die Unterstützungsdomäne für diese Kombination von und ist:a b
quelle
a
undb
beide weniger als 1000 jedenfalls), wierademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]]
zs[100,211]
.WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]
... ist es doppelt so schnell wie derOuter
Ansatz. Neugierig, welchen Code Sie verwenden? [Beide Ansätze können natürlich mitParallelTable
usw. schneller gemacht werden ]sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]
. Dann ZeitTally[sum[500000, 5, 7]]
. FürR
Aficianodos macht Folgendes dasselbe und dauert nur 50% länger als Mathematica :s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020")
.