Einfache Annäherung der kumulativen Poisson-Verteilung im langen Schwanz?

10

Ich möchte die Kapazität einer Tabelle so bestimmen , dass sie für ein gegebenes p [ 40 120 ] eine Restwahrscheinlichkeit von weniger als 2 - p zum Überlaufen aufweist , vorausgesetzt, die Anzahl der Einträge folgt einem Poisson-Gesetz mit einer gegebenen Erwartung E [ 10 310 12 ] .C2pp[40120]E[1031012]

Idealerweise möchte ich die niedrigste Ganzzahl, Cso dass 1-CDF[PoissonDistribution[E],C] < 2^-pfür gegeben pund E; aber ich bin zufrieden mit Cetwas höherem. Mathematica eignet sich gut für die manuelle Berechnung, aber ich möchte Cvon pund Ezur Kompilierungszeit berechnen , was mich auf 64-Bit-Ganzzahlarithmetik beschränkt.

Update: In Mathematica (Version 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]ist 1231und scheint es ungefähr richtig (danke @Procrastinator); Das Ergebnis ist jedoch für beide p = 50und p = 60ist 1250, was auf der unsicheren Seite falsch ist (und wichtig ist: Mein Experiment wiederholt sich wie Mal oder mehr, und ich möchte nachweislich weniger als 2 - 30 allgemeine Ausfallwahrscheinlichkeiten). Ich möchte eine grobe, aber sichere Annäherung, die nur 64-Bit-Ganzzahlarithmetik verwendet , wie sie zur Kompilierungszeit in C (++) verfügbar ist.225230

fgrieu
quelle
1
Wie wäre es C = Quantile[PoissonDistribution[E],1-2^p]?
1
Der Leitterm der Wahrscheinlichkeitsmassenfunktion des Poisson dominiert im Schwanz.
Kardinal
1
@Procrastinator: ja , das funktioniert in Mathematica ( mit Ausnahme von Zeichen pund Präzision Fragen und Namen Eund Cdie reserviert ist). ABER ich brauche eine einfache Annäherung daran, möglicherweise grob (aber auf der sicheren Seite), wenn nur eine 64-Bit-Ganzzahl-Arityhmetik verwendet wird!
fgrieu
3
p=50p=60
1
μ+loglogμlogμμ+pμlogμ

Antworten:

10

Eine Poisson-Verteilung mit großem Mittelwert ist ungefähr normal, aber Sie müssen darauf achten, dass Sie eine Schwanzbindung wünschen und die normale Näherung in der Nähe der Schwänze proportional weniger genau ist.

Ein Ansatz, der in dieser MO-Frage und bei Binomialverteilungen verwendet wird, besteht darin, zu erkennen, dass der Schwanz schneller abnimmt als eine geometrische Reihe, sodass Sie eine explizite Obergrenze als geometrische Reihe schreiben können.

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

plog2=log(bound)D=μ+cμ.

p=100μ=100010000138411/2100.06.0138311/299.59.

Douglas Zare
quelle
1
+1. Ein anderer Ansatz bezieht Poisson-Schwanzwahrscheinlichkeiten (rechts) auf Schwanzwahrscheinlichkeiten von Gamma-Verteilungen (links), die mit einer Sattelpunktnäherung genau (über) geschätzt werden können.
whuber
Davon ist ein langer Weg zu etwas, das auf 64-Bit-Ganzzahlarithmetik beschränkt ist (ohne exp, log, sqrt ..), aber ich werde daran arbeiten. Danke an alle!
fgrieu
(+1) Bis zum Aufruf von Stirlings Näherung (was irrelevant ist) ist dies genau die Grenze, auf die ich mich (undurchsichtig) in meinem Kommentar zum OP bezogen habe. ( Siehe zum Beispiel hier .)
Kardinal
2

Yλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0

Pavel Ruzankin
quelle
Wenn Sie die Schlüsselgleichung aufschreiben könnten (vorausgesetzt, es gibt nur eine oder zwei), würde dies helfen, falls die Verbindung irgendwann unterbrochen wird.
Jbowman