Beweis des zentralen Grenzwertsatzes ohne Verwendung charakteristischer Funktionen

11

Gibt es einen Beweis dafür, dass das CLT keine charakteristischen Funktionen verwendet, eine einfachere Methode?

Vielleicht Tikhomirov oder Steins Methoden?

Etwas Eigenständiges, das Sie einem Universitätsstudenten erklären können (erstes Jahr Mathematik oder Physik) und das weniger als eine Seite umfasst?

Skan
quelle
2
Ich habe einen solchen elementaren Ansatz unter stats.stackexchange.com/a/3904/919 skizziert . Die Verwendung von Funktionen zur Erzeugung von Kumulanten ist wohl die einfachste Methode: Ihr "einfacher" soll wahrscheinlich "elementarer" lauten.
whuber
2
Unter restriktiveren Bedingungen als bei Verwendung charakteristischer Funktionen können Sie stattdessen Momenterzeugungsfunktionen verwenden (tatsächlich war die erste CLT, die ich sah, von dieser Form) - aber die Darstellung ist ziemlich ähnlich.
Glen_b -Rate State Monica
@Glen_b Ich dachte auch, dass es mit Momenten einfacher sein könnte. Wie auch immer, ich werde die Frage offen lassen, falls jemand anderes eine andere Demonstration veröffentlicht.
Skan
Als Beweis ist es eigentlich nicht einfacher (der Beweis mit cfs kann in der gleichen Form geschrieben werden wie der Beweis mit mgfs), kann aber für Studenten vorzuziehen sein, die möglicherweise keinen Hintergrund mit Funktionen haben, die betreffen . Das heißt, Sie können die Einführung neuer Konzepte sparen, aber wenn diese Konzepte bereits vorhanden sind, ist es nicht schwieriger, die entsprechende Aussage mit cfs zu beweisen (obwohl dies allgemeiner ist). Ob dies besser ist, hängt von den Schülern ab, mit denen Sie es zu tun haben. i
Glen_b - Monica
Ich erinnere mich, dass mein Professor für Statistik im ersten Jahr einen visuellen "Beweis" für die CLT lieferte, indem er Stichprobenverteilungen des Mittelwerts mit unter verschiedenen Wahrscheinlichkeitsmodellen zeigte. Normal zeigte natürlich keine Tendenz, aber Exponential-, Bernoulli- und verschiedene Schwerschwanzverteilungen "abgerundet" visuell auf die bekannte Form pro Zunahme von n . n=10,100,1000n
AdamO

Antworten:

6

Sie können es mit Steins Methode beweisen, es ist jedoch fraglich, ob der Beweis elementar ist. Die positive Seite von Steins Methode ist, dass Sie eine etwas schwächere Form von Berry Esseen-Grenzen im Wesentlichen kostenlos erhalten. Auch Steins Methode ist nichts weniger als schwarze Magie! Eine Darstellung des Beweises finden Sie in Abschnitt 6 dieses Links . Weitere Beweise für das CLT finden Sie auch im Link.

Hier ist eine kurze Übersicht:

1) Beweisen Sie unter Verwendung einer einfachen Integration durch Teile und der Normalverteilungsdichte, dass für all stetig differenzierbar iff A ist N ( 0 , 1 ) verteilt. Es ist einfacher zu zeigen. Ein Normalfall impliziert das Ergebnis und ein bisschen schwieriger, das Gegenteil zu zeigen, aber vielleicht kann es im Glauben genommen werden.Ef(A)Xf(A)=0AN(0,1)A

2) Allgemeiner, wenn für jedes kontinuierlich differenzierbare f mit fEf(Xn)Xnf(Xn)0fkonvergiert X n in der Verteilunggegen N ( 0 , 1 ) , f ' begrenzt ist. Der Beweis hier ist wieder durch Teilintegration mit einigen Tricks. Insbesondere müssen wir wissen, dass die Konvergenz in der Verteilung äquivalent zu E g ( X n ) E istf,fXnN(0,1) für alle begrenzten stetigen Funktionen g . Fixing g , dies wird verwendet, um neu zu formulieren:Eg(Xn)Eg(A)gg

Eg(Xn)Eg(A)=Ef(Xn)Xnf(Xn),

wo man mit der grundlegenden ODE-Theorie nach auflöst und dann zeigt, dass f nett ist. Wenn wir also ein so schönes f finden können , geht das rhs unter der Annahme auf 0 und damit auch die linke Seite.fff

3) Beweisen Sie schließlich den zentralen Grenzwertsatz für wobeiXiiid mit Mittelwert 0 und Varianz 1 ist. Dies nutzt erneut den Trick in Schritt 2 aus, wobeiwirfür jedesgeinf finden,so dass:Yn:=X1++XnnXigf

Eg(Xn)Eg(A)=Ef(Xn)Xnf(Xn).
Alex R.
quelle
6

So würde ich es machen, wenn ich in der High School wäre.

Nehmen Sie eine beliebige Wahrscheinlichkeitsverteilung mit der Dichte , erhalten Sie den Mittelwert und die Varianz μ x , σ 2 x . Als nächstes approximieren Sie es mit der Zufallsvariablen z, die die folgende Form hat: z = μ x - σ x + 2 σ x ξ , wobei ξ die Bernoulli-Zufallsvariable mit dem Parameter p = 1f(x)μx,σx2z

z=μxσx+2σxξ,
ξ . Sie können sehen, dass μ z = μ x undp=1/2μz=μx .σz2=σx2

Nun können wir die Summe = n ( μ x - σ x ) + 2 σ x n i = 1 ξ i betrachten

Sn=i=1nzi
=n(μxσx)+2σxi=1nξi

Sie können die Binomialverteilung hier erkennen: , wobei ηη=i=1nξiηB(n,1/2)

In mancher Hinsicht könnte man also sagen, dass der Bernoulli die ungenaueste Näherung für jede Verteilung ist und sogar zur Normalität konvergiert.

Sie können beispielsweise zeigen, dass die Momente normal sind. Definieren wir einen Blick auf die Variable: y=(Sn/nμx)n

y=σx(1+2η/n)n

μy=σx(1+2(n/2)/n)n=0
Var[y]=σx2Var[2η/n]n=4σx2/nn(1/4)=σx2

n

Aksakal
quelle
Interessant. Ist es möglich, diese Idee in einen vollständigen Beweis zu verwandeln?
Elvis
@ Elvis, ich habe vor vielen Jahren versucht, wie ich selbst zu denken, und ich habe mich nicht so sehr für Beweise interessiert. Eine Sache, an die ich gedacht habe, ist, die kontinuierliche Verteilung als eine Kombination von
Bernoullis darzustellen
Was Sie oben geschrieben haben, könnte viel besser sein. Es ist nicht erforderlich, die Verteilung genau zu approximieren: Eine grobe Approximation durch eine Variable mit zwei verschiedenen Werten würde den Job erledigen.
Elvis
Das heißt, wenn es möglich ist, eine Grenze für die Genauigkeit der normalen Näherung abzuleiten. Ebenso ist die normale Näherung für die ursprüngliche Verteilung mindestens so gut wie für die skalierten Bernoulli. Oder eher etwas Schwächeres, das aber dennoch den Schluss zulässt.
Elvis