Erwartung der Quadratwurzel der Summe unabhängiger quadratischer einheitlicher Zufallsvariablen

9

Sei unabhängige und identisch verteilte standardmäßige einheitliche Zufallsvariablen.X1,,XnU(0,1)

Let Yn=inXi2I seek: E[Yn]


Die Erwartung von Yn ist einfach:

E[X2]=01y2y=13E[Yn]=E[inXi2]=inE[Xi2]=n3

Nun zum langweiligen Teil. Um LOTUS anzuwenden, würde ich das PDF von benötigen . Natürlich ist das PDF der Summe zweier unabhängiger Zufallsvariablen die Faltung ihrer PDFs. Hier haben wir jedoch Zufallsvariablen und ich denke, die Faltung würde zu einem ... verschlungenen Ausdruck führen (schreckliches Wortspiel beabsichtigt). Gibt es einen klügeren Weg?Ynn

Ich würde es vorziehen, die richtige Lösung zu sehen , aber wenn es unmöglich oder zu kompliziert ist, könnte eine asymptotische Näherung für großes akzeptabel sein. Durch Jensens Ungleichung weiß ich dasn

E[Yn]=n3E[Yn]

Aber das hilft mir nicht viel, es sei denn, ich finde auch eine nicht triviale Untergrenze. Beachten Sie, dass die CLT hier nicht direkt gilt, da wir die Quadratwurzel der Summe unabhängiger Wohnmobile haben, nicht nur der Summe unabhängiger Wohnmobile. Vielleicht könnte es andere Grenzwertsätze geben (die ich ignoriere), die hier hilfreich sein könnten.

DeltaIV
quelle
3
Siehe diese Frage für asymptotisches Ergebnis: stats.stackexchange.com/questions/241504/…
S. Catterall Reinstate Monica
4
Ich erhalte basierend auf der oben verlinkten Frage. E[Yn]n3115
S. Catterall stellt Monica
2
Ich glaube nicht, dass ich einen der in dieser Antwort beschriebenen Ansätze verwenden würde (von denen es mehr als zwei gibt!) :-). Der Grund dafür ist, dass Sie einfache, unkomplizierte Simulationen verwenden können, um die Erwartungen abzuschätzen, während eine analytische Lösung nicht erhältlich zu sein scheint. Ich mag den Ansatz von @ S.Catterall sehr (+1 für diese Lösung, die ich vorher nicht gelesen hatte). Die Simulation zeigt, dass es auch für kleine gut funktioniert . n
whuber
3
Die Simulation lohnt sich :-). Zeichnen Sie die Differenz zwischen dem simulierten Mittelwert und der ungefähren Formel gegen . Es zeigt Ihnen deutlich, wie gut die Approximation als Funktion von funktioniert . nnn
whuber
4
Es ist klar, dass während die Näherung . In diesem Fall wäre korrekt gewesen. Danach verbessert sich die Annäherung. E.[Y.1]]=0,513- -1fünfzehn=4fünfzehn0,51613- -112
Henry

Antworten:

11

Ein Ansatz besteht darin, zuerst die Momenterzeugungsfunktion (mgf) von zu berechnen, die durch wobei unabhängige und identisch verteilte einheitliche Standardzufallsvariablen sind .Y.nY.n=U.12++U.n2U.ich,ich=1,,n

Wenn wir das haben, können wir sehen, dass der von der Ordnung ist . Dann können wir Ergebnisse aus der Arbeit Noel Cressie und Marinus Borkent verwenden: "Die Momenterzeugungsfunktion hat ihre Momente", Journal of Statistical Planning and Inference 13 (1986) 337-344, die durch gebrochene Differenzierung der Momenterzeugungsfunktion gebrochene Momente liefert .

E.Y.n
Y.nα=1/.2

Zuerst die Momenterzeugungsfunktion von , die wir schreiben . und ich haben das (mit Hilfe von Maple und Wolphram Alpha) ausgewertet, um wobei die imaginäre Einheit ist. (Wolphram Alpha gibt eine ähnliche Antwort, jedoch in Bezug auf das Dawson-Integral. ) Es stellt sich heraus, dass wir meistens den Fall für benötigen . Nun ist es leicht, die mgf von zu finden : Dann für die Ergebnisse aus der zitierten Arbeit. FürU.12M.1(t)

M.1(t)=E.etU.12=01etx2xdx
M.1(t)=erf(- -t)π2- -t
ich=- -1 t<0YnMn(t)=M1(t)nμ>0μfIμf(t)Γ(μ) - 1 t - (t-z) μ - 1 f(z)t<0Y.n
M.n(t)=M.1(t)n
μ>0sie definieren das Integral Ordnung der Funktion als Dann ist für und nichtintegral eine positive ganze Zahl und so dass . Dann ist die Ableitung von der Ordnung definiert als Dann geben sie das folgende Ergebnis für eine positive Zufallsvariable (und beweisen es) : Angenommen, (mgf) ist definiert. Dann fürμf
ichμf(t)Γ(μ)- -1- -t(t- -z)μ- -1f(z)dz
α>0n0<λ<1α=n- -λfα
D.αf(t)Γ(λ)- -1- -t(t- -z)λ- -1dnf(z)dzndz.
X.M.X.α>0D α M X ( 0 ) = E X α < Y n α = 1 / 2 E Y 1 / 2 n = D 1 / 2 M n ( 0 ) = Γ ( 1 / 2 ) - 1 0 - | z | , Nun können wir versuchen, diese Ergebnisse auf anzuwenden . Mit finden wir wobei die Primzahl die Ableitung bezeichnet. Maple bietet die folgende Lösung: Ich werde ein Diagramm dieser Erwartung zeigen, das in Ahorn unter Verwendung numerischer Integration zusammen mit der ungefähren Lösung
D.αM.X.(0)=E.X.α<
Y.nα=1/.2
E.Y.n1/.2=D.1/.2M.n(0)=Γ(1/.2)- -1- -0|z|- -1/.2M.n'(z)dz
- -0n(erf(- -z)π- -2ez- -z)en(- -2ln2+2ln(erf(- -z))- -ln(- -z)+ln(π))22π(- -z)3/.2erf(- -z)dz
EIN(n)=n/.3- -1/.fünfzehnaus einem Kommentar (und in der Antwort von @Henry diskutiert). Sie sind bemerkenswert nah:

Vergleich genau und ungefähr

Als Ergänzung eine grafische Darstellung des prozentualen Fehlers:

Relativer Fehler (Prozent) im obigen Diagramm

Oberhalb von etwa die Annäherung nahezu exakt. Unterhalb des verwendeten Ahorncodes:n=20

int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t>0;
int( exp(t*x)/(2*sqrt(x)), x=0..1 ) assuming t<0;
M := t -> erf(sqrt(-t))*sqrt(Pi)/(2*sqrt(-t))
Mn := (t,n) -> exp(n*log(M(t)))
A  :=  n -> sqrt(n/3 - 1/15)
Ex :=  n ->   int( diff(Mn(z,n),z)/(sqrt(abs(z))*GAMMA(1/2) ), z=-infinity..0 ,numeric=true)

plot([Ex(n),A(n)],n=1..100,color=[blue,red],legend=[exact,approx],labels=[n,expectation],title="expectation of sum of squared uniforms")
plot([((A(n)-Ex(n))/Ex(n))*100],n=1..100,color=[blue],labels=[n,"% error"],title="Percentage error of approximation")
kjetil b halvorsen
quelle
1
sehr interessant. Wenn Sie einige Diagramme hinzufügen könnten, wäre dies eine hervorragende Antwort. Ich werde hier jedoch einen deutlichen Vorteil der CLT-Näherung feststellen. Die Annäherung zeigt deutlich, dass als wächst, wenn . Die Maple-Lösung funktioniert nicht (oder zumindest kann ich das nicht herausfinden). E.[Y.n]] nnn
DeltaIV
5

Als erweiterter Kommentar: Es scheint hier klar zu sein, dass mit beginnt wenn und sich dann nähert mit zunehmendem , bezogen auf die Varianz von , die von Richtung fällt . Meine verknüpfte Frage, die S.Catterall beantwortet hat, liefert eine Rechtfertigung für das asymptotische Ergebnis basierend auf jedem mit Mittelwert und VarianzE[E.[Y.n]]=E.[ichX.ich2]] n=1E.[Y.n]]=12=n3- -112n=1n3- -1fünfzehnnY.n1121fünfzehnn3- -1fünfzehnX.ich213445 , und die Verteilung ist ungefähr und asymptotisch normal.

Bei dieser Frage geht es effektiv um die Verteilung der Abstände vom Ursprung zufälliger Punkte in einem dimensionalen Einheitshyperwürfel . Es ähnelt einer Frage zur Verteilung der Abstände zwischen Punkten in einem solchen Hyperwürfel , sodass ich leicht anpassen kann, was ich dort getan habe, um die Dichten für verschiedene von bis mithilfe der numerischen Faltung anzuzeigen. Für passt die in Rot dargestellte vorgeschlagene normale Näherung gut, und ab eine Glockenkurve angezeigt. n[0,1]]nn116n=16n=4

Geben Sie hier die Bildbeschreibung ein

Für und Sie im Modus einen scharfen Peak mit der gleichen Dichte in beiden Fällen. Vergleichen Sie dies mit der Verteilung von , wobei die Glockenkurve mit und die Varianz proportional zun=2n=31ichX.ichn=3n

Henry
quelle
2
Die nahezu konstante Varianz führt zu möglicherweise kontraintuitiven Ergebnissen. Zum Beispiel mit , (der Abstand vom Ursprung eines zufälligen Punkt in einer -dimensionalen Einheit hypercube) kann von einem beliebigen Wert annehmen zu , aber der Fälle wird zwischen und und praktisch alle zwischen undn=400Y.40040002094%.11121013
Henry
1
es ist in der Tat ein bisschen kontraintuitiv. Aufgrund des Fluches der Dimensionalität hatte ich erwartet, dass die überwiegende Mehrheit der Punkte nahe an den Ecken liegt (Realisierungen st ). Stattdessen sieht es so aus, als ob die überwiegende Mehrheit der Punkte weit vom Ursprung entfernt ist, aber nicht so weit wie die Ecken. Wahrscheinlich besteht der Fehler darin, dass wir den Abstand vom Zentrum des Hyperwürfels berücksichtigen sollten , nicht den Abstand vom Ursprung , der gerecht ist eine der Ecken des Hyperwürfels. y400y400=20
DeltaIV
3
@ DeltaIV: Wenn Sie Ihre Hypercube-Seite so und vom Ursprung aus messen, erhalten Sie genau die gleiche Verteilung, Erwartung und Varianz. Mit meisten Punkte in diesem größeren Hypecube nahe der Grenze dieses Hypercubes (typischer Abstand in der Größenordnung von ), jedoch nicht nahe an seinen Ecken (typischer Abstand zum nächsten oder )[ - 1 , 1 ] n n = 400 0,02 11 122[- -1,1]]nn=4000,021112
Henry
1
das macht Sinn - ich hatte keine Zeit zum Rechnen, aber intuitiv erwartete ich ähnliche Ergebnisse für . Ich hatte erwartet, dass sich die Erwartung (Entschuldigung für das Wortspiel) um einen konstanten Faktor ändern würde, aber wie gesagt, ich hatte keine Zeit, sie zu überprüfen. U.([- -1,1]])
DeltaIV