Was ist die Varianz des Maximums einer Stichprobe?
13
B
Var(maxiXi)≤B,
X={X1,…,XM}Mμ1,…,μMσ21,…,σ2M
Ich kann darauf schließen, dass
Var(maxiXi)≤∑iσ2i,
aber diese Grenze scheint sehr locker zu sein. Ein numerischer Test scheint darauf hinzudeuten, dass B=maxiσ2i eine Möglichkeit sein könnte, aber ich konnte dies nicht beweisen. Jede Hilfe wird geschätzt.
(Wollen Sie annehmen, dass unabhängig ist?) Die Vermutung ist plausibel, scheint aber falsch zu sein. Führen Sie beispielsweise einige Versuche durch, bei denen mit CDF 1-x ^ {1-s} , 1 \ le x \ le \ infty , s \ gt 3 angezeigt wird . Die Varianz ihres Maximums im Verhältnis zu ihrer gemeinsamen Varianz nimmt mit wachsendem M ungebunden zu. XiXi1−x1−s1≤x≤∞s>3M
Whuber
@whuber Danke, das erklärt, warum ich diese Vermutung nicht beweisen konnte :) Mich interessiert in der Tat der Fall, in dem die unabhängig sind. Um es zu verdeutlichen, ich interessiere mich hauptsächlich für allgemeine Grenzen, die nur die ersten beiden Momente nutzen. Ich bin mir nicht sicher, ob es überhaupt schärfere allgemeine Grenzen gibt als die übliche Varianz. Xi
Peter
1
Ich sollte darauf hinweisen, dass Ihre gebundene Summe (vorausgesetzt, sie ist korrekt - es wäre schön, eine Skizze des Beweises zu sehen) eng ist. Zum Beispiel, lassen Sie im Intervall mit Abweichungen von nicht mehr als und lassen Sie auf . Dann ist as, mit der Varianz , aber die Ungleichung kann durch Schrumpfen beliebig verschärft werden . X2,…,XM[−∞,a]ε2X1[a,∞]maxiXi=X1σ21≤σ21+(M−1)ε2ε2
whuber
1
Für iid-Daten liefert die Extremwerttheorie die Verteilungsklassen, zu denen das Probenmaximum konvergiert, wobei bestimmte Bedingungen an den Enden der ursprünglichen Verteilungen verschiedene Klassen der asymptotischen Verteilungen ergeben. Ich bezweifle also, dass Sie nur auf der Grundlage der beiden Momente eine gute Grenze ableiten können, obwohl ich mit der Theorie nur tangential vertraut bin.
StasK
Antworten:
9
Für irgendwelche Zufallsvariablen X i , die beste allgemeine gebunden ist
V a r ( max X i ) ≤ & Sigma; i V a r ( X i ) , wie in der ursprünglichen Frage angegeben. Hier ist ein Beweis Skizze: Wenn X, Y IID ist dann E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Gegeben ein Vektor von möglicherweise abhängigen Variablen ( X 1 , …nXiVar(maxXi)≤∑iVar(Xi)E[(X−Y)2]=2Var(X) sei ( Y 1 , … , Y n ) ein unabhängiger Vektor mit der gleichen gemeinsamen Verteilung. Für jedes r > 0 haben wir durch die Vereinigung gebunden, dass P [ | max i X i - max i Y i | 2 > r ] ≤ ∑ i P [ | X i - Y i | 2 > r ](X1,…,Xn)(Y1,…,Yn)r>0P[|maxiXi−maxiYi|2>r]≤∑iP[|Xi−Yi|2>r]Und die Integration dieser von 0 bis ∞ Ausbeuten der beanspruchte Ungleichheit.dr0∞
Wenn IID-Indikatoren für Ereignisse der Wahrscheinlichkeit ϵ sind , dann ist max X i ein Indikator für ein Ereignis der Wahrscheinlichkeit n ϵ + O ( n 2 ϵ 2 ) . Befestigungs n und lassen ε auf Null neigen, erhalten wir V eine r ( X i ) = ε - ε 2 und V a r ( max i X i ) = n ε +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵ−ϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)
Eine Frage zu MathOverflow ist mit dieser Frage verbunden.
Bei IID-Zufallsvariablen wird das te Höchste als Ordnungsstatistik bezeichnet .k
Selbst für IID-Bernoulli-Zufallsvariablen kann die Varianz einer anderen Ordnungsstatistik als des Medians größer sein als die Varianz der Grundgesamtheit. Wenn beispielsweise ist 1 mit einer Wahrscheinlichkeit von 1 / 10 und 0 mit einer Wahrscheinlichkeit von 9 / 10 und M = 10 , dann ist die maximal 1 mit einer Wahrscheinlichkeit von ≈ 1 - 1 / e , so dass die Varianz der Bevölkerung ist 0,09 , während die Varianz des Maximums ist etwa 0,23 .Xi11/1009/10M=101≈1−1/e0.090.23
Hier sind zwei Artikel zu den Abweichungen der Auftragsstatistik:
Yang, H. (1982) "Über die Abweichungen des Medians und einige andere Ordnungsstatistiken." Stier. Inst. Mathematik. Acad. Sinica, 10 (2) S. 197-204
Ich glaube, die Obergrenze für die Varianz des Maximums in der zweiten Arbeit ist . Sie weisen darauf hin, dass Gleichheit nicht vorkommen kann, aber für IID Bernoulli-Zufallsvariablen ein niedrigerer Wert auftreten kann.Mσ2
Antworten:
Für irgendwelche Zufallsvariablen X i , die beste allgemeine gebunden ist V a r ( max X i ) ≤ & Sigma; i V a r ( X i ) , wie in der ursprünglichen Frage angegeben. Hier ist ein Beweis Skizze: Wenn X, Y IID ist dann E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Gegeben ein Vektor von möglicherweise abhängigen Variablen ( X 1 , …n Xi Var(maxXi)≤∑iVar(Xi) E[(X−Y)2]=2Var(X) sei ( Y 1 , … , Y n ) ein unabhängiger Vektor mit der gleichen gemeinsamen Verteilung. Für jedes r > 0 haben wir durch die Vereinigung gebunden, dass P [ | max i X i - max i Y i | 2 > r ] ≤ ∑ i P [ | X i - Y i | 2 > r ](X1,…,Xn) (Y1,…,Yn) r>0 P[|maxiXi−maxiYi|2>r]≤∑iP[|Xi−Yi|2>r] Und die Integration dieser von 0 bis ∞ Ausbeuten der beanspruchte Ungleichheit.dr 0 ∞
Wenn IID-Indikatoren für Ereignisse der Wahrscheinlichkeit ϵ sind , dann ist max X i ein Indikator für ein Ereignis der Wahrscheinlichkeit n ϵ + O ( n 2 ϵ 2 ) . Befestigungs n und lassen ε auf Null neigen, erhalten wir V eine r ( X i ) = ε - ε 2 und V a r ( max i X i ) = n ε +Xi ϵ maxXi nϵ+O(n2ϵ2) n ϵ Var(Xi)=ϵ−ϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)
quelle
Eine Frage zu MathOverflow ist mit dieser Frage verbunden.
Bei IID-Zufallsvariablen wird das te Höchste als Ordnungsstatistik bezeichnet .k
Selbst für IID-Bernoulli-Zufallsvariablen kann die Varianz einer anderen Ordnungsstatistik als des Medians größer sein als die Varianz der Grundgesamtheit. Wenn beispielsweise ist 1 mit einer Wahrscheinlichkeit von 1 / 10 und 0 mit einer Wahrscheinlichkeit von 9 / 10 und M = 10 , dann ist die maximal 1 mit einer Wahrscheinlichkeit von ≈ 1 - 1 / e , so dass die Varianz der Bevölkerung ist 0,09 , während die Varianz des Maximums ist etwa 0,23 .Xi 1 1/10 0 9/10 M=10 1 ≈1−1/e 0.09 0.23
Hier sind zwei Artikel zu den Abweichungen der Auftragsstatistik:
Yang, H. (1982) "Über die Abweichungen des Medians und einige andere Ordnungsstatistiken." Stier. Inst. Mathematik. Acad. Sinica, 10 (2) S. 197-204
Papadatos, N. (1995) "Maximale Varianz der Ordnungsstatistik." Ann. Inst. Statist. Math., 47 (1), S. 185-193
Ich glaube, die Obergrenze für die Varianz des Maximums in der zweiten Arbeit ist . Sie weisen darauf hin, dass Gleichheit nicht vorkommen kann, aber für IID Bernoulli-Zufallsvariablen ein niedrigerer Wert auftreten kann.Mσ2
quelle