Fehler in der normalen Annäherung an eine gleichmäßige Summenverteilung

20

Eine naive Methode zur Annäherung an eine Normalverteilung besteht darin, etwa IID-Zufallsvariablen, die gleichmäßig auf verteilt sind, zu addieren , neu zu zentrieren und neu zu skalieren, wobei auf den zentralen Grenzwertsatz zurückgegriffen wird. ( Randnotiz : Es gibt genauere Methoden wie die Box-Muller-Transformation .) Die Summe der IID -Zufallsvariablen wird als gleichmäßige Summenverteilung oder Irwin-Hall-Verteilung bezeichnet .100U ( 0 , 1 )[0,1]U(0,1)

Wie groß ist der Fehler bei der Annäherung einer gleichmäßigen Summenverteilung an eine Normalverteilung?

Immer wenn diese Art von Frage auftaucht, um die Summe der IID-Zufallsvariablen zu approximieren, bringen Leute (einschließlich ich) das Berry-Esseen-Theorem zur Sprache , das eine effektive Version des zentralen Grenzwertsatzes ist, vorausgesetzt, der dritte Moment existiert:

|Fn(x)-Φ(x)|Cρσ3n

wobei die kumulative Verteilungsfunktion für die neu skalierte Summe von IID-Zufallsvariablen ist, ist das absolute dritte zentrale Moment, ist die Standardabweichung und ist eine absolute Konstante, die mit oder sogar .FnnρE|(X-EX)3|σC11/2

Das ist unbefriedigend. Es scheint mir, dass die Berry-Esseen-Schätzung bei diskreten Binomialverteilungen der Schärfe am nächsten kommt, wobei der größte Fehler bei einer symmetrischen Binomialverteilung bei . Der größte Fehler tritt beim größten Sprung auf. Die gleichmäßige Summenverteilung weist jedoch keine Sprünge auf.0

Numerische Tests legen nahe, dass der Fehler schneller als .c/n

Mit 1/2 ist die Berry-Esseen-Schätzung| F n ( x ) - Φ ( x ) | 1C=1/2

|Fn(x)-Φ(x)|121321123n0,650n

was für , ungefähr , bzw. ist. Die tatsächlichen maximalen Differenzen für scheinen ungefähr , bzw. , die viel kleiner sind und als anstelle von zu fallen scheinen .0,205 0,145 0,103 n = 10 , 20 , 40 0,00281 0,00139 0,000692 c / n c / n=10,20,400,2050,1450,103n=10,20,400,002810,001390,000692c/nc/n

Douglas Zare
quelle
7
Wenn Sie die Verteilung der Summe in einer Edgeworth-Erweiterung erweitern , stellen Sie fest, dass gleichmäßig in x als n (seit Die Gleichverteilung ist symmetrisch. klingt also ungefähr richtig. Aufgrund des Terms ist dies jedoch nicht Fn(x)=Φ(x)+n-1G(x)+O(n-1)xno ( n - 1 )c/nO(n-1)
bindend
1
Danke, das scheint das Muster auch für viele andere Distributionen zu erklären . c/n
Douglas Zare

Antworten:

17

Sei iid U ( - b , b ) Zufallsvariablen und betrachte die normierte Summe S n = U1,U2,U(-b,b)

Sn=3ich=1nUichbn,
δ n = sup x R | F n ( x ) - Φ ( x ) |supF n S n
δn=supxR|Fn(x)-Φ(x)|,
FnSn

Lemma 1 ( Uspensky ): Die folgende Schranke für gilt. δ n < 1δn

δn<17.5πn+1π(2π)n+12π3nexp(-π2n/24).

Beweis . Siehe JV Uspensky (1937), Einführung in die mathematische Wahrscheinlichkeit , New York: McGraw-Hill, p. 305.

Dies wurde später von R. Sherman zu folgenden verbessert.

Lemma 2 ( Sherman ): Die folgende Verbesserung der Uspensky-Grenze gilt.

δn<17.5πn-(π180+17.5πn)e-π2n/24+1(n+1)π(2π)n+12π3ne-π2n/24.

Beweis : Siehe R. Sherman, Fehler der normalen Annäherung an die Summe von N Zufallsvariablen , Biometrika , vol. 58, nein. 2, 396–398.

Der Beweis ist eine ziemlich einfache Anwendung der Dreiecksungleichung und der klassischen Schranken am Ende der Normalverteilung und von auf die charakteristischen Funktionen jeder der beiden Verteilungen.(Sündex)/x

Kardinal
quelle
2
+1 Ist in Lemma 2? N=n
@ Procrastinator: Guter Fang.
Kardinal
1
Vielen Dank! Diese Referenzen sind sehr hilfreich. Die Schätzungen scheinen innerhalb eines Faktors von des tatsächlichen Wertes zu liegen. 2
Douglas Zare