Was ist die Varianz des Maximums einer Stichprobe?

$B$

Var (max_{i} X_{i}) \leq B,

$\mbox{Var}(\max_i X_i) \leq B \enspace,$

X = {X_{1}, \dots, X_{M}}

$X = \{ X_1, \ldots, X_M \}$

M

$M$

μ_{1}, \dots, μ_{M}

$\mu_1, \ldots, \mu_M$

σ_{1}^{2}, \dots, σ_{M}^{2}

$\sigma_1^2, \ldots, \sigma_M^2$

Ich kann darauf schließen, dass

Var (max_{i} X_{i}) \leq \sum_{i} σ_{i}^{2},

$\mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace,$ aber diese Grenze scheint sehr locker zu sein. Ein numerischer Test scheint darauf hinzudeuten, dass

B = max_{i} σ_{i}^{2}

$B = \max_i \sigma_i^2$ eine Möglichkeit sein könnte, aber ich konnte dies nicht beweisen. Jede Hilfe wird geschätzt.

variance bounds maximum Peter
quelle

(Wollen Sie annehmen, dass unabhängig ist?) Die Vermutung ist plausibel, scheint aber falsch zu sein. Führen Sie beispielsweise einige Versuche durch, bei denen mit CDF

. Die Varianz ihres Maximums im Verhältnis zu ihrer gemeinsamen Varianz nimmt mit wachsendem

ungebunden zu.

X_{i}

$X_i$

X_{i}

$X_i$

1 - x^{1 - s}

$1-x^{1-s}$

1 \leq x \leq \infty

$1\le x\le \infty$

s > 3

$s\gt 3$

M

$M$

Whuber

@whuber Danke, das erklärt, warum ich diese Vermutung nicht beweisen konnte :) Mich interessiert in der Tat der Fall, in dem die unabhängig sind. Um es zu verdeutlichen, ich interessiere mich hauptsächlich für allgemeine Grenzen, die nur die ersten beiden Momente nutzen. Ich bin mir nicht sicher, ob es überhaupt schärfere allgemeine Grenzen gibt als die übliche Varianz.

X_{i}

$X_i$

Peter

Ich sollte darauf hinweisen, dass Ihre gebundene Summe (vorausgesetzt, sie ist korrekt - es wäre schön, eine Skizze des Beweises zu sehen) eng ist. Zum Beispiel, lassen Sie im Intervall mit Abweichungen von nicht mehr als und lassen Sie auf . Dann ist as, mit der Varianz , aber die Ungleichung kann durch Schrumpfen beliebig verschärft werden .

X_{2}, \dots, X_{M}

$X_2,\ldots,X_M$

[- \infty, a]

$[-\infty, a]$

ε^{2}

$\varepsilon^2$

X_{1}

$X_1$

[a, \infty]

$[a,\infty]$

max_{i} X_{i} = X_{1}

$\max_i{X_i}=X_1$

σ_{1}^{2} \leq σ_{1}^{2} + (M - 1) ε^{2}

$\sigma_1^2\le\sigma_1^2+(M-1)\varepsilon^2$

ε^{2}

$\varepsilon^2$

whuber

Für iid-Daten liefert die Extremwerttheorie die Verteilungsklassen, zu denen das Probenmaximum konvergiert, wobei bestimmte Bedingungen an den Enden der ursprünglichen Verteilungen verschiedene Klassen der asymptotischen Verteilungen ergeben. Ich bezweifle also, dass Sie nur auf der Grundlage der beiden Momente eine gute Grenze ableiten können, obwohl ich mit der Theorie nur tangential vertraut bin.

StasK

Antworten:

Für irgendwelche Zufallsvariablen , die beste allgemeine gebunden ist , wie in der ursprünglichen Frage angegeben. Hier ist ein Beweis Skizze: Wenn X, Y IID ist dann . Gegeben ein Vektor von möglicherweise abhängigen Variablen $n$ $X_i$ $\newcommand{\Var}{\mathrm{Var}}\Var(\max X_i) \le \sum_i \Var(X_i)$ $E[(X-Y)^2] =2\Var(X)$ sei ein unabhängiger Vektor mit der gleichen gemeinsamen Verteilung. Für jedes haben wir durch die Vereinigung gebunden, dass $(X_1,\ldots ,X_n)$ $(Y_1,\ldots ,Y_n)$ $r>0$ $P[ |\max_i X_i-\max_i Y_i|^2 >r] \le \sum_i P[ | X_i-Y_i|^2 >r]$ Und die Integration dieser von bis Ausbeuten der beanspruchte Ungleichheit. $dr$ $0$ $\infty$

Wenn IID-Indikatoren für Ereignisse der Wahrscheinlichkeit , dann ist ein Indikator für ein Ereignis der Wahrscheinlichkeit . Befestigungs und lassen auf Null neigen, erhalten wir und $X_i$ $\epsilon$ $\max X_i$ $n\epsilon+O(n^2 \epsilon^2)$ $n$ $\epsilon$ $\Var(X_i)=\epsilon-\epsilon^2$ . $\Var(\max_i X_i)= n\epsilon +O(n^2\epsilon^2)$

Yuval Peres
quelle

Eine Frage zu MathOverflow ist mit dieser Frage verbunden.

Bei IID-Zufallsvariablen wird das te Höchste als Ordnungsstatistik bezeichnet . $k$

Selbst für IID-Bernoulli-Zufallsvariablen kann die Varianz einer anderen Ordnungsstatistik als des Medians größer sein als die Varianz der Grundgesamtheit. Wenn beispielsweise ist mit einer Wahrscheinlichkeit von und mit einer Wahrscheinlichkeit von und , dann ist die maximal mit einer Wahrscheinlichkeit von , so dass die Varianz der Bevölkerung ist , während die Varianz des Maximums ist etwa . $X_i$ $1$ $1/10$ $0$ $9/10$ $M=10$ $1$ $\approx 1- 1/e$ $0.09$ $0.23$

Hier sind zwei Artikel zu den Abweichungen der Auftragsstatistik:

Yang, H. (1982) "Über die Abweichungen des Medians und einige andere Ordnungsstatistiken." Stier. Inst. Mathematik. Acad. Sinica, 10 (2) S. 197-204

Papadatos, N. (1995) "Maximale Varianz der Ordnungsstatistik." Ann. Inst. Statist. Math., 47 (1), S. 185-193

Ich glaube, die Obergrenze für die Varianz des Maximums in der zweiten Arbeit ist . Sie weisen darauf hin, dass Gleichheit nicht vorkommen kann, aber für IID Bernoulli-Zufallsvariablen ein niedrigerer Wert auftreten kann. $M\sigma^2$

Douglas Zare
quelle