Was ist die Varianz des Maximums einer Stichprobe?

13

B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

Ich kann darauf schließen, dass

Var(maxiXi)iσi2,
aber diese Grenze scheint sehr locker zu sein. Ein numerischer Test scheint darauf hinzudeuten, dass B=maxiσi2 eine Möglichkeit sein könnte, aber ich konnte dies nicht beweisen. Jede Hilfe wird geschätzt.
Peter
quelle
3
(Wollen Sie annehmen, dass unabhängig ist?) Die Vermutung ist plausibel, scheint aber falsch zu sein. Führen Sie beispielsweise einige Versuche durch, bei denen mit CDF 1-x ^ {1-s} , 1 \ le x \ le \ infty , s \ gt 3 angezeigt wird . Die Varianz ihres Maximums im Verhältnis zu ihrer gemeinsamen Varianz nimmt mit wachsendem M ungebunden zu. XiXi1x1s1xs>3M
Whuber
@whuber Danke, das erklärt, warum ich diese Vermutung nicht beweisen konnte :) Mich interessiert in der Tat der Fall, in dem die unabhängig sind. Um es zu verdeutlichen, ich interessiere mich hauptsächlich für allgemeine Grenzen, die nur die ersten beiden Momente nutzen. Ich bin mir nicht sicher, ob es überhaupt schärfere allgemeine Grenzen gibt als die übliche Varianz. Xi
Peter
1
Ich sollte darauf hinweisen, dass Ihre gebundene Summe (vorausgesetzt, sie ist korrekt - es wäre schön, eine Skizze des Beweises zu sehen) eng ist. Zum Beispiel, lassen Sie im Intervall mit Abweichungen von nicht mehr als und lassen Sie auf . Dann ist as, mit der Varianz , aber die Ungleichung kann durch Schrumpfen beliebig verschärft werden . X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber
1
Für iid-Daten liefert die Extremwerttheorie die Verteilungsklassen, zu denen das Probenmaximum konvergiert, wobei bestimmte Bedingungen an den Enden der ursprünglichen Verteilungen verschiedene Klassen der asymptotischen Verteilungen ergeben. Ich bezweifle also, dass Sie nur auf der Grundlage der beiden Momente eine gute Grenze ableiten können, obwohl ich mit der Theorie nur tangential vertraut bin.
StasK

Antworten:

9

Für irgendwelche Zufallsvariablen X i , die beste allgemeine gebunden ist V a r ( max X i ) & Sigma; i V a r ( X i ) , wie in der ursprünglichen Frage angegeben. Hier ist ein Beweis Skizze: Wenn X, Y IID ist dann E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Gegeben ein Vektor von möglicherweise abhängigen Variablen ( X 1 , nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X) sei ( Y 1 , , Y n ) ein unabhängiger Vektor mit der gleichen gemeinsamen Verteilung. Für jedes r > 0 haben wir durch die Vereinigung gebunden, dass P [ | max i X i - max i Y i | 2 > r ] i P [ | X i - Y i | 2 > r ](X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r]Und die Integration dieser von 0 bis Ausbeuten der beanspruchte Ungleichheit.dr0

Wenn IID-Indikatoren für Ereignisse der Wahrscheinlichkeit ϵ sind , dann ist max X i ein Indikator für ein Ereignis der Wahrscheinlichkeit n ϵ + O ( n 2 ϵ 2 ) . Befestigungs n und lassen ε auf Null neigen, erhalten wir V eine r ( X i ) = ε - ε 2 und V a r ( max i X i ) = n ε +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)

Yuval Peres
quelle
3

Eine Frage zu MathOverflow ist mit dieser Frage verbunden.

Bei IID-Zufallsvariablen wird das te Höchste als Ordnungsstatistik bezeichnet .k

Selbst für IID-Bernoulli-Zufallsvariablen kann die Varianz einer anderen Ordnungsstatistik als des Medians größer sein als die Varianz der Grundgesamtheit. Wenn beispielsweise ist 1 mit einer Wahrscheinlichkeit von 1 / 10 und 0 mit einer Wahrscheinlichkeit von 9 / 10 und M = 10 , dann ist die maximal 1 mit einer Wahrscheinlichkeit von 1 - 1 / e , so dass die Varianz der Bevölkerung ist 0,09 , während die Varianz des Maximums ist etwa 0,23 .Xi11/1009/10M=10111/e0.090.23

Hier sind zwei Artikel zu den Abweichungen der Auftragsstatistik:

Yang, H. (1982) "Über die Abweichungen des Medians und einige andere Ordnungsstatistiken." Stier. Inst. Mathematik. Acad. Sinica, 10 (2) S. 197-204

Papadatos, N. (1995) "Maximale Varianz der Ordnungsstatistik." Ann. Inst. Statist. Math., 47 (1), S. 185-193

Ich glaube, die Obergrenze für die Varianz des Maximums in der zweiten Arbeit ist . Sie weisen darauf hin, dass Gleichheit nicht vorkommen kann, aber für IID Bernoulli-Zufallsvariablen ein niedrigerer Wert auftreten kann.Mσ2

Douglas Zare
quelle