Unabhängigkeit von Stichprobenmittelwert und Stichprobenvarianz in der Binomialverteilung

Sei . Wir wissen, dass und . Bedeutet dies , dass die Probe Mittelwert und die Probenvarianz sind abhängig voneinander? Oder bedeutet es nur, dass die Populationsvarianz als Funktion des Populationsmittelwerts geschrieben werden kann ? $X\sim\mathrm{Binomial}(n,p)$ $\mathrm{E}[X]=np$ $\mathrm{Var}[X]=np(1-p)$ $\bar x$ $s^2$

distributions binomial independence user6874652
quelle

Antworten:

undsind Zufallsvariablen. Wir können ihre gemeinsame Verteilung ausarbeiten. Versuchen wir den einfachsten nichttrivialen Fall, den einer Stichprobe der Größeaus einer Binomialverteilung. Für diese Stichprobe gibt es nur vier Möglichkeiten, die hiermit zusammen mit ihren Wahrscheinlichkeiten tabellarisch aufgeführt werden (berechnet aus der Unabhängigkeit der beiden Stichprobenelemente): $\bar x$ $s^2$ $2$ $(1,p)$

First value | Second value | Mean | Variance | Probability
          0 |            0 |    0 |        0 | (1-p)^2
          0 |            1 |  1/2 |      1/2 | (1-p)p
          1 |            0 |  1/2 |      1/2 | p(1-p)
          1 |            1 |    1 |        0 | p^2

Der Mittelwert sagt die Varianz in diesem Beispiel perfekt voraus. Vorausgesetzt, alle Wahrscheinlichkeiten sind ungleich Null (dh ist weder noch ), sind der Stichprobenmittelwert und die Stichprobenvarianz nicht unabhängig. $p$ $0$ $1$

Eine interessante Frage ist, ob, wenn in einer Verteilungsfamilie der Mittelwert die Varianz bestimmt, der Stichprobenmittelwert und die Stichprobenvarianz unabhängig sein können. Die Antwort lautet ja: Nehmen Sie eine Familie von Normalverteilungen, bei denen die Varianz vom Mittelwert abhängt, z. B. die Menge aller Normalverteilungen . Unabhängig davon, welche dieser Verteilungen die Stichprobe regelt, sind der Stichprobenmittelwert und die Stichprobenvarianz unabhängig, da dies bei jeder Normalverteilung der Fall ist . $(\mu, \mu^2)$

Diese Analyse legt nahe, dass Fragen zur Struktur einer Verteilungsfamilie (die , , usw. betreffen ) keinen Einfluss auf Fragen der Unabhängigkeit der Statistik von Stichproben von einem bestimmten Element der Familie haben. $n$ $p$ $\mu$

whuber
quelle

Aber vielleicht liegt das daran, dass die Normalverteilung ein "Sonderfall" ist? Ich meine, es ist bekannt, dass für jede Normalverteilung der Stichprobenmittelwert unabhängig von der Stichprobenvarianz ist. Aber was passiert, wenn es sich um eine Distribution handelt, bei der es sich nicht um eine Normalverteilung handelt?

user6874652

Typischerweise sind der Stichprobenmittelwert und die Stichprobenvarianz nicht unabhängig voneinander. Es spielt keine Rolle, zu welcher Verteilungsfamilie die Verteilung gehören könnte.

whuber

@whuber: Außer dass mit

der Stichprobenmittelwert und die Stichprobenvarianz unabhängig sind.

N (μ, σ^{2})

$N(\mu, \sigma^2)$

Michael Hardy

@ Michael Danke. Ich habe das bereits im Hauptteil der Antwort bemerkt.

whuber

@whuber: danke für die analyse. Könnten Sie bitte auch den RCode offenlegen ? Danke vielmals.

Maximilian

Die Eigenschaft, dass für eine iid-Stichprobe der Stichprobenmittelwert und die Stichprobenvarianz unabhängig sind, ist eine Charakterisierung der Normalverteilung: Für keine andere Verteilung gilt eine solche Eigenschaft.

Siehe Patel, JK & Read, CB (1982). Handbuch der Normalverteilung , p. 81 in der 1. Ausgabe von 1982, im Kapitel "Charakterisierungen" (möglicherweise Seiten in der 2. Ausgabe von 1996 geändert).

Für jede andere Verteilung sind der Stichprobenmittelwert und die Stichprobenvarianz statistisch abhängig.

Das allgemeine Ergebnis in Bezug auf den Stichprobenmittelwert und die Stichprobenvarianz aus einer iid-Stichprobe einer Verteilung mit Momenten bis zum 3d ist das folgende (unter Verwendung des unverzerrten Schätzers für die Varianz):

Cov (\bar{X}, s^{2}) = E (\bar{X} s^{2}) - E (x) Var (x) = \frac{1}{n} E [X - E (x)]^{3}

$\operatorname{Cov} (\bar X, s^2) = E(\bar X s^2) - E(x)\operatorname{Var}(x) = \frac 1n E[X-E(x)]^3$

$n$

1) Mit zunehmender Stichprobengröße neigen die beiden dazu, unkorreliert zu werden.

2) Für jede Verteilung, bei der das dritte zentrale Moment gleich Null ist, sind sie nicht korreliert (obwohl sie für alle Verteilungen außer der Normalen abhängig bleiben). Dies schließt natürlich alle Verteilungen ein, die symmetrisch zu ihrem Mittelwert sind, aber auch andere Verteilungen, die nicht symmetrisch zu ihrem Mittelwert sind, aber dennoch das dritte zentrale Moment gleich Null haben , siehe diesen Thread .

Alecos Papadopoulos
quelle

(+1) Der Hyperlink ist für mich tot.

COOLSerdash

@ COOLSerdash Es funktioniert bei mir. Es verlinkt auf eine Amazon-Seite, vielleicht ist das für Sie gesperrt?

Graipherie

@ COOLSerdash Danke. Wie bereits erwähnt, scheint der Hyperlink gültig zu sein. Suchen Sie einfach nach "Handbuch der Normalverteilung Patel Read".

Alecos Papadopoulos

(+1) Ich habe vermutet, dass dies der Fall sein könnte, habe aber noch nie eine formelle Erklärung dieser Tatsache gesehen. Gibt es nicht normale Verteilungen, für die der Stichprobenmittelwert und die Stichprobenvarianz nicht korreliert sind?

John Coleman

@AlecosPapadopoulos Ja, natürlich. Wenn ja, dann wäre es ein interessantes Beispiel dafür, wenn unkorreliert nicht unabhängig bedeutet. Ich habe nicht alle Details herausgearbeitet, aber es U(0,1)scheint zu funktionieren.

John Coleman

$\operatorname{Bernoulli}(p) = \operatorname{Binomial}(1,p).$ $N:$

\begin{aligned} N. s^{2} = \sum_{k = 1}^{N.} (x_{k} - - \bar{x})^{2} = & (\sum_{k} x_{k}^{2}) - - (2 \bar{x} \sum_{ich} x_{k}) + (N. {\bar{x}}^{2}) \\ = & (\sum_{k} x_{k}) - - 2 \bar{x} \sum_{k} x_{k} + (n {\bar{x}}^{2}) \\ schon seit x_{k} = 0 oder 1, damit x_{k}^{2} = x_{k} \\ = & N. \bar{x} - - 2 N. {\bar{x}}^{2} + N. {\bar{x}}^{2} \\ = & N. \bar{x} (1 - - \bar{x}), \\ damit s^{2} = & \bar{x} (1 - - \bar{x}) . \end{aligned}

$\begin{align} Ns^2 = \sum_{k=1}^N (x_k - \overline x)^2 = {} & \left( \sum_k x_k^2 \right) - \left( 2\overline x \sum_i x_k \right) + \left( N\overline x^2 \right) \\[10pt] = {} & \left( \sum_k x_k \right) - 2\overline x \sum_k x_k + \left( n\overline x^2 \right) \\ & \text{since $x_k = 0$ or $1$, so $x_k^2=x_k$} \\[12pt] = {} & N\overline x - 2N\overline x^2 + N \overline x^2 \\[10pt] = {} & N \overline x(1-\overline x), \\[10pt] \text{so } s^2 = {} & \overline x(1-\overline x). \end{align}$

n

$n$

1,

$1,$

\bar{x}

$\overline x$

\bar{x} (1 - \bar{x}) .

$\overline x(1-\overline x).$

$np$ $n(1-p)$

Michael Hardy
quelle