CLT mit Zufallsvariablen, die nicht integrierbar sind

8

Aufgabe 15.5.1 aus Klenkes "Wahrscheinlichkeitstheorie: Ein umfassender Kurs" lautet wie folgt. Finden Sie eine Folge unabhängiger reeller Zufallsvariablen mit für alle so dass Ich bin mir nicht sicher, wie dies möglich ist, wenn der Mittelwert in diesem Fall nicht einmal definiert ist. Alle Fälle, die ich mir für Variablen mit undefiniertem Mittelwert vorstellen kann, erfüllen keinen zentralen Grenzwertsatz mit einer -Skalierung. Jede Hilfe wird geschätzt.X1,X2,E[|Xn|]=nN

X1++XnnnN(0,1).
n
guest0877
quelle
1
Tipp: Reduzieren Sie die Konzepte auf ihre Grundelemente. Da das Normal das Herzstück des CLT ist, beginnen Sie mit dem Standard Normal . Modifizieren Sie sie dann so, dass (a) jeder einen unendlichen erwarteten absoluten Wert hat, während (b) der Änderungsbetrag mit schnell abnimmt , so dass in der Grenzdivision durch der modifizierte Teil "abgetötet" wird. Eine einfache Möglichkeit, eine Zufallsvariable zu ändern, besteht darin, eine weitere hinzuzufügen. Xinn
whuber
@whuber Ist Ihr Punkt, dass die Zufallsvariablen nicht identisch verteilt sein sollen? Wenn sie es wären, würde ich dem OP zustimmen.
Michael R. Chernick
@whuber Auch erfordert die Antwort, dass nur Xn den unendlichen Mittelwert hat.
Michael R. Chernick
Ich denke, das "für alle n" bedeutet, dass alle Xi einen unendlichen absoluten Mittelwert haben. Ich versuche hier vorsichtig zu sein. Ich möchte Ihren Hinweis verstehen, aber nicht etwas sagen, das die Lösung für das OP verrät.
Michael R. Chernick
1
@ Michael Wenn sie iid wären, wäre das Ergebnis nicht wahr. Die Idee ist, den Teil von zu machen, der bewirkt, dass die unendliche Erwartung mit zunehmendem immer weniger Chancen hat, . Ein guter Weg, dies zu tun, ist mit einer Mischung. nXnn
whuber

Antworten:

6

Unter den vielen Möglichkeiten, dieses Problem zu lösen, scheint die Konstruktion der Sequenz durch Störung einer normalen Standardvariablen die einfachste und eleganteste zu sein.

Am Ende kommentiere ich den Zusammenhang mit dem zentralen Grenzwertsatz.


Charakteristische Funktionen

Erlauben Sie mir einen Exkurs, bevor ich eine Lösung vorstelle. Die Inspiration für die verwendete Technik stammt von der Idee, dass es mehr als einen Weg gibt, die Verteilung einer Zufallsvariablen zu beschreiben . Am gebräuchlichsten und direktesten ist seine Verteilungsfunktion . Eine indirekte, aber äußerst nützliche Alternative ist ihre charakteristische FunktionF X ( x ) = Pr ( X x )X FX(x)=Pr(Xx)

ψX(t)=E[eitX]=E[cos(tX)]+iE[sin(tX)].

Da für alle , ist für jede Verteilung (und ihre Werte für alle dürfen nicht größer sein ). Darüber hinaus haben und genau dann die gleiche Verteilung, wenn sie die gleiche charakteristische Funktion haben. Noch besser ist Lévys Kontinuitätssatz: Eine Folge konvergiert in der Verteilung genau dann zu einer Zufallsvariablen wenn für jedes die Folge gegen einen Wert und die Funktion konvergiertt F F t 1 X Y X n X t X n ( t ) ( t ) 0 0 X.|eitX|=1tψFFt1XYXnXtϕXn(t)ψ(t)ψist kontinuierlich bei . (Alle charakteristischen Funktionen bei durchgehend sind ) . In diesem Fall ist die charakteristische Funktion von .00ψX

Eine weitere schöne Eigenschaft charakteristischer Funktionen ist ihre Beziehung zu linearen Kombinationen: Wenn und Zufallsvariablen sind (auf demselben Wahrscheinlichkeitsraum und und reelle Zahlen sind,Y α βXYαβ

(1)ψαX+βY(t)=ψX(αt)ψY(βt).

Dies macht charakteristische Funktionen (cfs) zu einem geeigneten Werkzeug für die Untersuchung von Störungen von Zufallsvariablen die durch Hinzufügen winziger Mengen anderer Zufallsvariablen erreicht werden, dh Zufallsvariablen der Form fürklein.Y X + β Y | β |XYX+βY|β|


Lösung

Konstruktion einer Sequenz

Lassen Sie uns eine Lösung konstruieren, indem wir mit einer Standardnormalvariablen und eine unabhängige Folge mit derselben Verteilung wie . Dies hat offensichtlich die von uns gewünschte begrenzende Eigenschaft: Die Mittelwerte sind alle Standardnormal, daher ist der Mittelwert im Grenzwert Standardnormal.Z 1 , Z 2 , , Z n , Z.ZZ1,Z2,,Zn,Z

Sein vgl. Ist

(2)ψZ(t)=et2/2.

Wählen Sie für die Störungen eine Zufallsvariable mit unendlicher Erwartung. Für es praktisch , ein cf zu haben, mit dem man leicht arbeiten kann. Ich möchte die Lévy-Verteilung (auch bekannt als stabile Verteilung mit oder Inverse Gamma -Verteilung) vorschlagen, für dieY α = 1 / 2 , β = 1 ( 1 / 2 , 1 / 2 )YYα=1/2, β=1(1/2,1/2)

ψY(t)=e|t|(1isgn(t)).

(Für ist ; für )t>0t < 0 , sgn ( t ) = - 1sgn(t)=1t<0, sgn(t)=1

Diese Verteilung wird am und hat keine endlichen Momente.(0,)

Zu dieser Folge von Standardnormalvariablen fügen wir immer kleinere positive Vielfache von . Y(Zn)Y(Positivität ist nicht , erleichtert jedoch die Arbeit mit der Funktion .) Die zu bestimmende Folge von Vielfachen sei . Somit ist die Folge von Zufallsvariablen definiert als wobei eine iid-Folge von Zufallsvariablen mit der gleichen Verteilung wie .p 1 , p 2 , p 3 , , X n = Z n + p n Y n ( Y n ) Y.sgnp1,p2,p3,,

Xn=Zn+pnYn
(Yn)Y

Intuition

Wir müssen uns Sorgen machen, ob die Störungen so schlimm sind, dass sie die Konvergenz zu einer Standardnormalverteilung ruinieren. Für diejenigen, die Erfahrung mit solch schwerfälligen Verteilungen haben, ist dies ein echtes Problem: Es wird immer eine positive Wahrscheinlichkeit geben, dass das kleine Stück das zu hinzugefügt wird, gelegentlich einen so großen Ausreißer einführt, dass es die Teilsumme überwältigt . Der gesamte Grund für die Verwendung charakteristischer Funktionen besteht darin, zu demonstrieren, dass dies auf lange Sicht nicht passieren wird, vorausgesetzt, wir reduzieren das Ausmaß der Störung ( ) ausreichend schnell.Z n S n p nYnZnSnpn


Formale Berechnungen

Erstens hat unendliche Erwartungen, weilXn

E[Xn]=E[Zn+pnYn]=E[Z]+pnE[Y]=pnE[Y]

muss unendlich sein, da unendlich ist. Somit erfüllt diese Sequenz alle Anforderungen des Problems.E[Y](Xn)

Wenden wir uns der Analyse der Teilmittel zu. Wiederholte Anwendung von auf den Teilmittelwert(1)

Sn=X1+X2++Xnn

gibt

(3)ψSn(t)=[e(t/n)2/2ψY(p1t/n)][e(t/n)2/2ψY(pnt/n)]=[e(t/n)2/2e(t/n)2/2][ψY(p1t/n)ψY(pnt/n)]=et2/(2n)t2/(2n)t2/(2n)e|p1t/n|(1+isgn(p1t/n)e|pnt/n|(1+isgn(pnt/n).

Das Sammeln der schwarzen Potenzen von ergibt die Potenz während das Sammeln der blauen Potenzen (die aus den Störungen stammen) ergibtet2/2

(4)i=1n|pit/n|(1+isgn(pit/n))=|t|(1+isgn(t))i=1npin1/4

weil und alle positiv sind. Seit , für jedes feste der Wert von auf Null, wenn zunimmt, vorausgesetztEine Möglichkeit, dies zu erreichen, besteht darin, die Summe der konvergieren zu lassen: Nehmen Sie zum Beispiel . Dannnpi|1+isgn(t)|2t(4)ni=1npi=o(n1/4).pipi=22i

1n1/4i=1npi1n1/4(1/2+1/4++1/2n+)=1n1/40.

Folglich konvergieren die blauen Terme , da das Exponential bei stetig ist , gegen : Sie beeinflussen die Grenze nicht. Wir schließen daraus, dass zu konvergiert . Da dies der Standard der Standardnormalverteilung ist, impliziert Lévys Kontinuitätssatz, dass zu einer Standardnormalverteilung, QED, konvergiert .( 3 ) e 0 = 1 ( ψ S n ) ψ X S n0(3)e0=1(ψSn)ψXSn


Bemerkungen

Die hier gezeigten Ideen können verallgemeinert werden. Wir brauchen nicht, dass Standard Normal ist. es genügt (nach dem üblichen zentralen Grenzwertsatz), dass sie mit dem Mittelwert Null und der Einheitsvarianz iid sind. Es sieht so aus, als hätten wir eine Erweiterung der CLT etabliert: Die Verteilung der Mittelwerte einer Folge unabhängiger Zufallsvariablen, auch solche mit unendlichen Erwartungen und Varianzen, kann (wenn angemessen standardisiert) zu einer Standardnormalverteilung konvergieren, vorausgesetzt, der "unendliche Teil" der Zufallsvariablen wird ausreichend schnell klein.Xn

whuber
quelle