Ich möchte die Kapazität einer Tabelle so bestimmen , dass sie für ein gegebenes p ∈ [ 40 … 120 ] eine Restwahrscheinlichkeit von weniger als 2 - p zum Überlaufen aufweist , vorausgesetzt, die Anzahl der Einträge folgt einem Poisson-Gesetz mit einer gegebenen Erwartung E ∈ [ 10 3 … 10 12 ] .
Idealerweise möchte ich die niedrigste Ganzzahl, C
so dass 1-CDF[PoissonDistribution[E],C] < 2^-p
für gegeben p
und E
; aber ich bin zufrieden mit C
etwas höherem. Mathematica eignet sich gut für die manuelle Berechnung, aber ich möchte C
von p
und E
zur Kompilierungszeit berechnen , was mich auf 64-Bit-Ganzzahlarithmetik beschränkt.
Update: In Mathematica (Version 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]
ist 1231
und scheint es ungefähr richtig (danke @Procrastinator); Das Ergebnis ist jedoch für beide p = 50
und p = 60
ist 1250
, was auf der unsicheren Seite falsch ist (und wichtig ist: Mein Experiment wiederholt sich wie Mal oder mehr, und ich möchte nachweislich weniger als 2 - 30 allgemeine Ausfallwahrscheinlichkeiten). Ich möchte eine grobe, aber sichere Annäherung, die nur 64-Bit-Ganzzahlarithmetik verwendet , wie sie zur Kompilierungszeit in C (++) verfügbar ist.
quelle
C = Quantile[PoissonDistribution[E],1-2^p]
?p
und Präzision Fragen und NamenE
undC
die reserviert ist). ABER ich brauche eine einfache Annäherung daran, möglicherweise grob (aber auf der sicheren Seite), wenn nur eine 64-Bit-Ganzzahl-Arityhmetik verwendet wird!Antworten:
Eine Poisson-Verteilung mit großem Mittelwert ist ungefähr normal, aber Sie müssen darauf achten, dass Sie eine Schwanzbindung wünschen und die normale Näherung in der Nähe der Schwänze proportional weniger genau ist.
Ein Ansatz, der in dieser MO-Frage und bei Binomialverteilungen verwendet wird, besteht darin, zu erkennen, dass der Schwanz schneller abnimmt als eine geometrische Reihe, sodass Sie eine explizite Obergrenze als geometrische Reihe schreiben können.
quelle
quelle