Erwartete Häufigkeit, mit der der empirische Mittelwert einen Wert überschreitet

Bei einer gegebenen Folge von iid-Zufallsvariablen sagen wir $X_i \in [0,1]$ für $i = 1,2,...,n$ , ich versuche die erwartete Anzahloft die empirischen Mittelwert gebunden $\frac{1}{n}\sum_{i=1}^n X_i$ überschreitet einen Wert, $c \geq 0$ , wenn wir weiterhin Proben zeichnen, dh:

T \overset{d e f}{=} \sum_{j = 1}^{n} P ({\frac{1}{j} \sum_{i = 1}^{j} X_{i} \geq c})

$\mathcal{T} \overset{def}{=} \sum_{j=1}^n \mathbb{P} \left(\left\{ \frac{1}{j}\sum_{i=1}^j X_i \geq c\right\}\right)$

Wenn wir annehmen, dass $c = a + \mathbb{E}[X]$ für einige $a > 0$ , können wir Hoeffdings Ungleichung verwenden , um zu erhalten

\begin{aligned} T & \leq \sum_{j = 1}^{n} e^{- 2 j a^{2}} \\ = \frac{1 - e^{- 2 a^{2} n}}{e^{2 a^{2}} - 1} \end{aligned}

$\begin{align} \mathcal{T} & \leq \sum_{j=1}^n e^{-2ja^2} \\ & = \frac{1 - e^{-2 a^2 n}}{e^{2 a^2}-1} \end{align}$

Was (vielleicht) gut aussieht, aber eigentlich ziemlich locker gebunden ist, gibt es bessere Möglichkeiten, diesen Wert zu begrenzen? Ich gehe davon aus, dass es einen Weg geben kann, da die verschiedenen Ereignisse (für jedes $j$ ) eindeutig nicht unabhängig sind. Mir ist kein Weg bekannt, diese Abhängigkeit auszunutzen. Es wäre auch schön, die Einschränkung zu entfernen, dass $c$ größer als der Mittelwert ist.

edit : Die Einschränkung auf größer als der Mittelwert ist, kann aufgehoben werden, wenn wirMarkovs Ungleichungwie folgt verwenden: $c$

Was allgemeiner ist, aber viel schlimmer als die oben angegebene Grenze, obwohl klar ist, dassimmer dann divergieren muss, wenn.

\begin{aligned} T & \leq \sum_{j = 1}^{n} \frac{\frac{1}{j} E [X]}{c} \\ = \frac{E [X] H_{n}}{c} \end{aligned}

$\begin{align} \mathcal{T} & \leq \sum_{j=1}^n \frac{\frac{1}{j}\mathbb{E}[X]}{c} \\ & = \frac{\mathbb{E}[X]H_n}{c} \end{align}$

T

$\mathcal{T}$

c \leq E [X]

$c \leq \mathbb{E}[X]$

mathematical-statistics expected-value bounds Fairidox
quelle

Ihre Definition von

stimmt nicht mit Ihrer Beschreibung überein. Wenn das "

" entfernt würde, wäre es die erwartete Anzahl von Überschreitungen von

, aber wie geschrieben ist es eine lineare Kombination der Zeiten . Dies ist offensichtlich keine Erwartung, da sich die Wahrscheinlichkeiten nicht gegenseitig ausschließen. Wenn zum Beispiel

, ist

T

$\mathcal{T}$

j \times

$j\times$

c

$c$

c \leq 0

$c\le 0$

T = n (n + 1) / 2

$\mathcal{T} = n(n+1)/2$

whuber

@whuber oh, richtig, guter Punkt danke, ich habe es oben behoben.

Fairidox

Ich stelle fest, dass Sie Ihre Obergrenze geändert haben. Es scheint jetzt negativ zu sein ;-).

whuber

Sollte das "

" im Exponential nicht quadriert werden? - Ok, es vereinfacht sich mit der Domain [0,1]

j

$j$

Alecos Papadopoulos

Dies ist ein ziemlich handgemachter Ansatz, und ich würde mich sehr über einen Kommentar dazu freuen (und die kritisierenden sind normalerweise die hilfreichsten). Wenn ich das richtig verstehe, berechnet das OP die Stichprobenmittelwerte , wobei jede Stichprobe die vorherige Stichprobe +1 Beobachtung aus einem neuen rv enthält. Bezeichnen Sie die Verteilung jedes Stichprobenmittelwerts. Dann können wir schreiben $\bar x_j$ $F_j$

T \overset{d e f}{=} \sum_{j = 1}^{n} (1 - F_{j} (c)) = n - \sum_{j = 1}^{n} F_{j} (c)

$\mathcal{T} \overset{def}{=} \sum_{j=1}^n \left(1-F_j(c)\right) = n- \sum_{j=1}^n F_j(c)$

Betrachten wir eine Stichprobengröße , nach der die Verteilung der Probe Mittelwert fast normal ist, bezeichnen es $m$ $\hat G$ . Dann können wir schreiben

T = n - \sum_{j = 1}^{m} F_{j} (c) - \sum_{j = m + 1}^{n} {\hat{G}}_{j} (c) < n - \sum_{j = m + 1}^{n} {\hat{G}}_{j} (c)

$\mathcal{T} = n- \sum_{j=1}^m F_j(c)-\sum_{j=m+1}^n \hat G_j(c) < n-\sum_{j=m+1}^n \hat G_j(c)$

Die Lösung erhalten wir $\hat G_j(c)$ wobeidie Standardnormal-cdf ist,die Standardabweichung des iid-Prozesses ist undsein Mittelwert ist. Einfügen in die Bindung und Neuanordnung erhalten wir

{\hat{G}}_{j} (c) = 1 - Φ (\frac{\sqrt{j}}{σ} (μ - c))

$\hat G_j(c) = 1- \Phi\left(\frac{\sqrt j}{\sigma}(\mu-c)\right)$

Φ

$\Phi$

σ

$\sigma$

μ

$\mu$

T < m + \sum_{j = m + 1}^{n} Φ (\frac{\sqrt{j}}{σ} (- a))

$\mathcal{T} < m+\sum_{j=m+1}^n \Phi\left(\frac{\sqrt j}{\sigma}(-a)\right)$

Beachten Sie, dass diese Grenze auch von der Varianz des Prozesses abhängt. Ist dies eine bessere Bindung als die in der Frage dargestellte? Dies hängt entscheidend davon ab, wie "schnell" die Verteilung des Stichprobenmittelwerts "fast normal" wird. Um ein numerisches Beispiel zu geben, nehmen wir an, dass . Angenommen, die Zufallsvariablen sind in einheitlich . Dann ist $m= 30$ $[0,1]$ und $\sigma = \sqrt \frac{1}{12}$ $\mu = \frac 12$ $a=0.05$ $n=34$ $n>30$ $n=100$ $78.5$ $36.2$ $\approx 199.5$ $\approx 38.5$ $a$ $a=0.1$ , der Hoeffding konvergent gebunden $49.5$ while the bound I propose converges to $30.5$ (i.e the sum of the normal cdfs contributes very little to the overall bound).
Somewhat more generally, we note that for $n\rightarrow \infty$ the Hoeffding bound converges to

H_{b} \to \frac{1}{e^{2 a^{2}} - 1}

$H_b\rightarrow \frac{1}{e^{2 a^2}-1}$ while my bound to

A_{b} \to m

$A_b \rightarrow m$

Since for small values of $a$ (which is rather the case of interest) $H_b$ becomes a large number, there is still the case that $A_b$ may outperform it in tightness, even if the sample is such that the distribution of the sample mean converges slowly to the normal distribution.

Alecos Papadopoulos
quelle

"(i.e no more than the assumed sample-size threshold one needs to get the normal approximation in the distribution of the sample mean)" what are you talking about here?

Glen_b -Reinstate Monica

Nothing important. As I write some lines above, a rule of thumb so that the distribution of the sample mean is "a lot" like normal, is that we need at least a sample size of 30. So for sample size 100, and a 20% deviation case, my bound is

\approx 30.5

$\approx 30.5$ i.e.

m + 0.5

$m + 0.5$ - in other words the

\sum_{j = m + 1}^{n} Φ (\frac{\sqrt{j}}{σ} (- a))

$\sum_{j=m+1}^n \Phi\left(\frac{\sqrt j}{\sigma}(-a)\right)$ part of the bound contributes very little.

Alecos Papadopoulos

Unless you can state the circumstances under which it holds, please avoid calling that thing a rule of thumb in any general sense. The figure of 30 is completely arbitrary (usually either far too weak or far too strong), and that 30 also turns up in your case is, I believe simple coincidence.

Glen_b -Reinstate Monica

@Glen_b "30" was not even a coincidence - I just used it to provide a numerical example. I have no objection to the issue, I don't like "rules of thumb" (especially when they are dubious). I have made some changes in my answer. Thanks for the input.

Alecos Papadopoulos

@Glen_b Thanks for the possibly non-stationary (i.e. long) memory!

Alecos Papadopoulos

Erwartete Häufigkeit, mit der der empirische Mittelwert einen Wert überschreitet

Antworten: