Zentraler Grenzwertsatz für Quadratwurzeln von Summen von iid-Zufallsvariablen

11

Ich bin fasziniert von einer Frage bei math.stackexchange und untersuche sie empirisch. Ich wundere mich über die folgende Aussage über die Quadratwurzel von Summen von iid-Zufallsvariablen.

Angenommen, sind iid Zufallsvariablen mit einem endlichen Mittelwert ungleich Null und Varianz und . Der zentrale Grenzwertsatz besagt wenn zunimmt. μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Wenn , kann ich auch so etwas wie sagen wenn zunimmt?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Angenommen, die sind Bernoulli mit dem Mittelwert und der Varianz , dann ist binomial und ich kann dies in R simulieren, beispielsweise mit : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

Dies ergibt ungefähr den erhofften Mittelwert und die erhoffte Varianz fürZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

und ein QQ-Diagramm, das Gauß nahe kommt

qqnorm(Z)

Geben Sie hier die Bildbeschreibung ein

Henry
quelle
1
@ MichaelM: Danke für diese Kommentare. Ich hatte mit dem nicht negativen begonnen , aber ich dachte, das von Ihnen beschriebene intuitive asymptotische Verhalten ermöglichte eine Verallgemeinerung auf mehr Verteilungen. Meine Überraschungen waren (a) die Varianz der Quadratwurzel der Summe, die anscheinend zu einer Konstanten tendiert, die nicht von abhängt, und (b) das Auftreten einer Verteilung, die Gauß sehr nahe kommt. Ein Gegenbeispiel wäre willkommen, aber als ich andere Fälle ausprobierte, die anfangs nicht Gaußsch wirkten, schien eine weitere Erhöhung von die Verteilung wieder auf ein CLT-Ergebnis zu bringen. n nXinn
Henry
Eine Folge davon ist der quadratische Mittelwert (oder quadratische Mittelwert) von iid-Zufallsvariablen, der in geeigneter Weise skaliert ist (multipliziert mit wie bei einem arithmetischen Mittelwert), konvergiert ebenfalls zu einer Gaußschen Verteilung, vorausgesetzt, das Moment des Die zugrunde liegende Verteilung ist endlich. 4n4
Henry
3
Nur ein kurzer Kommentar: Die Behauptung ist ein Sonderfall der Delta-Methode, siehe Satz 5.5.24 im Buch "Statistical Inference" von Casella & Berger.
Michael M
@Michael: Vielleicht sehen Sie etwas, das ich im Moment nicht bin, aber ich denke nicht, dass dieses spezielle Problem in die Annahmen der klassischen Delta-Methode passt (z. B. wie in dem Satz angegeben, auf den Sie verweisen). Beachten Sie, dass in der Verteilung nicht konvergiert (nicht trivial auf ) und daher "die Delta-Methode mit anwenden " nicht die erforderlichen Anforderungen erfüllt. Wie die Antwort von S. Catterall jedoch zeigt, bietet sie eine nützliche Heuristik, die zur richtigen Antwort führt. R g ( y ) = YRg(y)=|y|
Kardinal
(Ich glaube, Sie könnten den Beweis der Delta-Methode an Fälle anpassen, die den oben genannten ähnlich sind, um die oben genannte Heuristik vollständig rigoros zu machen.)
Kardinal

Antworten:

14

Die Konvergenz zu einem Gaußschen ist in der Tat ein allgemeines Phänomen.

Angenommen, sind IID-Zufallsvariablen mit dem Mittelwert und der Varianz , und definieren Sie die Summen . Fixiere eine Zahl . Der übliche zentrale Grenzwertsatz besagt, dass als , wobei ist das standard normale cdf. Die Kontinuität des einschränkenden cdf impliziert jedoch, dass wir auchX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
weil der zusätzliche Term auf der rechten Seite der Ungleichung gegen Null tendiert. Das Umordnen dieses Ausdrucks führt zu
P(Yn(ασ2μ+nμ)2)Φ(α)

Wenn wir Quadratwurzeln ziehen und feststellen, dass impliziert, dass , erhalten wir Mit anderen Worten, . Dieses Ergebnis zeigt die Konvergenz zu einem Gaußschen im Grenzwert als .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Bedeutet dies, dass eine gute Annäherung an für großes ? Nun, wir können es besser machen. Wie @Henry bemerkt, können wir unter der Annahme, dass alles positiv ist, zusammen mit und die Approximation , um die verbesserte Approximation wie in der obigen Frage angegeben. Beachten Sie auch, dass wir immer noch weilnμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 als .n
S. Catterall stellt Monica wieder her
quelle
Möglicherweise müssen Sie als hinzufügen , um mein Ergebnis zu erhaltennμnμσ24μ0n
Henry
@Henry Sie können für jede Konstante durch ersetzen. Dies ändert nicht die Grenzverteilung, kann jedoch den Grad ändern, in dem ist eine gute Annäherung an für ein bestimmtes großes . Wie sind Sie auf ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall stellt Monica
Wir haben also . Unter der Annahme, dass alles positiv ist, ist während der Nenner von schlägt , und das Kombinieren dieser führt zu . Var(Z)=E[Z2](E[Z])2 E[Z2]=E[Y]=nμE[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ Var(Z)σ2|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry
Ok, danke, ich habe versucht, dies jetzt in meiner Antwort zu behandeln.
S. Catterall stellt Monica