Betrachten Sie ∑ N i = 1 | X i |
Wie viele der größten Begriffe machen die Hälfte der Gesamtsumme aus?
Zum Beispiel erreichen 10 + 9 + 8 ≈
Definieren
sumbiggest (j ; X 1 … X N ) ≡ Summe der j größten von | X 1 | … | X N |
Halbsumme ( N ) ≡ das kleinste j, so dass sumbiggest (j) ≈ sumbiggest ( N ) / 2 .
Gibt es ein allgemeines asymptotisches Ergebnis für die Halbsumme ( N , μ , σ
Eine einfache, intuitive Ableitung wäre schön.
(Ein wenig Monte Carlo schlägt vor, dass manchmal die halbe Summe ( N
das heißt, das größte Viertel des X i
Ich erhalte 0,24 N
Antworten:
Nein, es gibt kein allgemeines asymptotisches Ergebnis. Sei x [ 1 ] … x [ N ] das geordnete x i , wobei x [ 1 ] das größte ist.x[1]…x[N] xi x[1]
Betrachten Sie die folgenden zwei Beispiele:
1) P ( x = 0 ) = 1 . Klar gilt das CLT. Sie benötigen nur M = 1 Beobachtung für ∑ M j = 1 | x [ j ] | ≥ 1P(x=0)=1 M=1 2 ∑N| xi| . ∑Mj=1|x[j]|≥12∑N|xi|
2) P ( x = 1 ) = 1 . Klar gilt das CLT. Sie benötigen M = ⌈ N / 2 ⌉ Beobachtungen für ∑ M j = 1 | x [ j ] | ≥ 1P(x=1)=1 M=⌈N/2⌉ 2 ∑N| xi| .∑Mj=1|x[j]|≥12∑N|xi|
Für ein nicht triviales Beispiel ist die Bernoulli-Verteilung:
3) P ( x = 1 ) = p , P ( x = 0 ) = 1 - p . Wieder einmal gilt das CLT. Sie benötigen ⌈ p N / 2 the der Beobachtungen, um Ihre Bedingungen zu erfüllen. Durch Variieren von p zwischen 0 und 1 können Sie Beispiel 1 oder Beispiel 2 so nahe kommen, wie Sie möchten.P(x=1)=p, P(x=0)=1−p ⌈pN/2⌉ p
quelle
Hier ist ein grobes Argument, das eine etwas andere Schätzung für gleichmäßig verteilte Zufallsvariablen gibt. Angenommen, X i sind kontinuierliche Zufallsvariablen, die gleichmäßig auf [ 0 , 1 ] verteilt sind . Dann hat ∑ i X i den Mittelwert N / 2 . Nehmen wir an, dass durch einen überraschenden und absolut unglaublichen Zufall die Summe genau gleich N / 2 ist . So wir , wie viele der größten Werte schätzen wollen X Summe bis zu N / 4 oder mehr. Nun ist das Histogramm von N Proben ( N.Xi [0,1] ∑iXi N/2 N/2 X N/4 N N very large) drawn from the uniformm distribution U[0,1]U[0,1]
is roughly flat from 00 to 11 , and so for any xx , 0<x<10<x<1 , there are
(1−x)N(1−x)N samples distributed roughly uniformly between xx to 11 . These
samples have average value (1+x)/2(1+x)/2 and sum equal to
(1−x)N(1+x)/2)=(1−x2)N/2(1−x)N(1+x)/2)=(1−x2)N/2 . The sum exceeds N/4N/4 for x≤1/√2x≤1/2–√ .
So, the sum of (1−1/√2)N≈0.3N(1−1/2–√)N≈0.3N largest samples exceeds
N/4N/4 .
You could try and generalize this a bit. If ∑iXi=Y∑iXi=Y , then for
any given YY , we want xx to be such that (1−x2)N/2=Y/2(1−x2)N/2=Y/2 where
YY is normal with mean N/2N/2 and variance N/12N/12 . Thus, conditioned
on a value of YY , x=√1−(Y/N)x=1−(Y/N)−−−−−−−−−√ . Multiply by the
density of YY and integrate (from Y=0Y=0 to Y=NY=N ) to find the
average number of largest samples that will exceed half the random sum.
quelle
Let's assume X has just positive values to get rid of the absolute value.
Without an exact prove, I think you have to solve for k
(1−FX(k))E(X|X>=k)=12E(X) with F being the cumulative distribution function for X
and then the answer is given by taking the n(1−FX(k)) highest values.
My logic is that asymtopically the sum of all values higher than k should be about
n(1−FX(k))E(X|X>=k)
and asymtopically half the total sum is about
12nE(X).
Numerical simulation show that the result holds for the uniform case (uniform in [0,1]) where F(k)=k and I get k=√(12). I am not certain if the result always hold or if it can be simplified further, but I think it really depends on the distribution function F.
quelle