Zentraler Grenzwertsatz für Stichprobenmediane

54

Wenn ich den Median einer ausreichend großen Anzahl von Beobachtungen aus derselben Verteilung berechne, gibt der zentrale Grenzwertsatz dann an, dass die Verteilung der Mediane einer Normalverteilung nahekommt? Ich verstehe, dass dies mit den Mitteln einer großen Anzahl von Proben zutrifft, aber gilt dies auch für Mediane?

Wenn nicht, wie ist die zugrunde liegende Verteilung der Stichprobenmediane?

normal-distribution mathematical-statistics sampling median central-limit-theorem user1728853
quelle

9

Sie benötigen einige Regelmäßigkeitsbedingungen, damit der Median bei einer Neuskalierung im Grenzwert eine Normalverteilung aufweist. Um zu sehen, was schief gehen kann, ziehen Sie eine Verteilung über eine endliche Anzahl von Punkten in Betracht, beispielsweise uniform on .

X

$X$

{- 1, 0, 1}

$\{-1,0,1\}$

Kardinal

5

Hinsichtlich der Regularitätsbedingungen: Wenn die zugrunde liegende Verteilung eine Dichte aufweist, die am (wahren) Median differenzierbar ist, weist der Stichprobenmedian eine asymptotische Normalverteilung mit einer von dieser Ableitung abhängigen Varianz auf. Dies gilt allgemeiner für beliebige Quantile.

Kardinal

6

@ cardinal Ich glaube, Sie brauchen zusätzliche Bedingungen: Wenn die Dichte zweitdifferenzierbar ist, im Median gleich Null ist und dort die erste Ableitung Null hat, ist die asymptotische Verteilung des Stichprobenmedians bimodal.

whuber

4

@whuber: Ja, da die Dichte (nicht ihre Ableitung, wie ich zuvor versehentlich angegeben habe) als Kehrwert in die Varianz eingeht, darf der Wert der Dichte an diesem Punkt nicht Null sein. Entschuldigung für das Fallenlassen dieser Bedingung!

Kardinal

4

Elementare counterexamples kann jede beliebige Verteilung erstellt werden , die Wahrscheinlichkeit zuordnet auf ein Intervall und die Wahrscheinlichkeit bis , wo wie beispielsweise a Bernoulli ( ). Stichprobenmediane sind kleiner oder gleich so oft sie größer oder gleich . Die Wahrscheinlichkeit, dass der Median nicht in nähert sich für große Stichproben, wodurch effektiv eine "Lücke" in

1 / 2

$1/2$

(- \infty, μ]

$(-\infty,\mu]$

1 / 2

$1/2$

[μ + δ, \infty)

$[\mu+\delta,\infty)$

δ > 0,

$\delta\gt 0,$

(1 / 2)

$(1/2)$

μ = 0, δ = 1

$\mu=0,\delta=1$

μ

$\mu$

μ + δ

$\mu+\delta$

(μ, μ + δ)

$(\mu,\mu+\delta)$

0

$0$

(μ, μ + δ)

$(\mu,\mu+\delta)$ in der Grenzverteilung - die dann natürlich nicht normal ist, egal wie sie standardisiert ist.

Whuber

38

Wenn Sie in Bezug auf Indikatorvariablen arbeiten (dh wenn und andernfalls), können Sie den zentralen Grenzwertsatz direkt auf einen Mittelwert von anwenden und mit der Delta-Methode in eine asymptotische Normalverteilung für , was wiederum bedeutet, dass Sie eine asymptotische Normalität für feste Quantile von . $Z_i = 1$ $X_i \leq x$ $0$ $Z$ $F_X^{-1}(\bar{Z})$ $X$

Also nicht nur der Median, sondern auch Quartile, 90. Perzentile usw.

Wenn wir über das te Stichprobenquantil in ausreichend großen Stichproben sprechen , erhalten wir, dass es ungefähr eine Normalverteilung mit dem Mittelwert des ten Populationsquantils und der Varianz . $q$ $q$ $x_q$ $q(1-q)/(nf_X(x_q)^2)$

Für den Median ( ) die Varianz in ausreichend großen Stichproben ungefähr . $q = 1/2$ $1/(4nf_X(\tilde{\mu})^2)$

Sie brauchen natürlich alle Bedingungen auf dem Weg zum Halten, damit es nicht in allen Situationen funktioniert, sondern für kontinuierliche Verteilungen, bei denen die Dichte im Populationsquantil positiv und differenzierbar ist, usw.

Außerdem gilt dies nicht für extreme Quantile, da die CLT dort nicht einschaltet (der Durchschnitt der Zs ist nicht asymptotisch normal). Sie brauchen eine andere Theorie für Extremwerte.

Edit: Whubers Kritik ist richtig; Dies würde funktionieren, wenn ein Populationsmedian und kein Stichprobenmedian wäre. Das Argument muss geändert werden, damit es ordnungsgemäß funktioniert. $x$

Glen_b
quelle

5

Ich denke, ein logischer Teil dieser Erklärung könnte fehlen: Wie genau verwendet man Indikatoren, um Stichprobenmediane zu erhalten ? Ich kann sehen, wie wenn der zugrunde liegende Median ist, der Indikator funktioniert: aber dieser Indikator stimmt nicht mit dem Stichprobenmedian oder einer Funktion davon überein.

x

$x$

X_{i} \leq x

$X_i\le x$

Whuber

Wie geht man von asymptotischen Normalverteilungen für

, um eine asymptotische Normalität für feste Quantile von X zu erhalten? Edit: Ich habe es verstanden, dass

ein Prozentwert von 0-100% wird, daher sind Quantilwerte asymptotisch normal

F_{X}^{- 1} (\bar{Z})

$F^{−1}_X (\overline{Z})$

\bar{Z}

$\overline{Z}$

adam

48

Die Schlüsselidee ist, dass die Stichprobenverteilung des Medians einfach als Verteilungsfunktion auszudrücken ist, aber komplizierter als der Medianwert. Sobald wir verstanden haben, wie die Verteilungsfunktion Werte als Wahrscheinlichkeiten wiedergeben kann, ist es einfach, die genaue Stichprobenverteilung des Medians abzuleiten . Eine kleine Analyse des Verhaltens der Verteilungsfunktion in der Nähe ihres Medians ist erforderlich, um zu zeigen, dass dies asymptotisch normal ist.

(Dieselbe Analyse gilt für die Stichprobenverteilung eines beliebigen Quantils, nicht nur für den Median.)

Ich werde nicht versuchen, bei dieser Darstellung streng zu sein, aber ich führe sie in Schritten durch, die ohne weiteres streng gerechtfertigt sind, wenn Sie die Absicht haben, dies zu tun.

Intuition

Dies sind Schnappschüsse einer Box mit 70 Atomen eines heißen Atomgases:

Abbildung 1

In jedem Bild habe ich einen Ort gefunden, der als rote vertikale Linie dargestellt ist und die Atome in zwei gleiche Gruppen zwischen den linken (als schwarze Punkte gezeichneten) und rechten (weißen Punkten) aufteilt. Dies ist ein Median der Positionen: 35 der Atome liegen zu seiner Linken und 35 zu seiner Rechten. Die Mediane ändern sich, weil sich die Atome zufällig um die Box bewegen.

Wir sind an der Verteilung dieser Mittelstellung interessiert. Eine solche Frage wird durch Umkehren meines Verfahrens beantwortet: Zeichnen wir zunächst eine vertikale Linie, beispielsweise an Position . Wie groß ist die Chance, dass sich die Hälfte der Atome links von und die Hälfte rechts davon befindet? Die Atome links hatten einzeln die Chance, dass links ist. Die Atome rechts hatten einzeln die Chance rechts zu sein. Unter der Annahme, dass ihre Positionen statistisch unabhängig sind, multiplizieren sich die Chancen und ergeben $x$ $x$ $x$ $1-x$ $x^{35}(1-x)^{35}$ für die Chance dieser besonderen Konfiguration. Eine äquivalente Konfiguration könnte für eine unterschiedliche Aufteilung der Atome in zwei Teile mit Elementen erreicht werden. Das Addieren dieser Zahlen für alle möglichen derartigen Teilungen ergibt eine Chance von $70$ $35$

Pr (x is a median) = C x^{n / 2} (1 - x)^{n / 2}

${\Pr}(x\text{ is a median}) = C x^{n/2} (1-x)^{n/2}$

Dabei ist die Gesamtzahl der Atome und ist proportional zur Anzahl der Teilungen von Atomen in zwei gleiche Untergruppen. $n$ $C$ $n$

Diese Formel gibt die Verteilung des Medians als Beta Verteilung $(n/2+1, n/2+1)$ .

Betrachten Sie nun eine Box mit einer komplizierteren Form:

Figur 2

Auch hier variieren die Mediane. Da die Box in der Nähe des Zentrums niedrig ist, gibt es dort nicht viel von ihrem Volumen: eine kleine Änderung des Volumens, das die linke Hälfte der Atome einnimmt (die schwarzen noch einmal) - oder, wir könnten genauso gut zugeben, Der in diesen Abbildungen gezeigte linke Bereich entspricht einer relativ großen Änderung der horizontalen Position des Medians. Tatsächlich werden die Änderungen in den Medianen durch die Höhe der Box dividiert , da die Fläche, die von einem kleinen horizontalen Abschnitt der Box begrenzt wird, proportional zur Höhe dort ist . Dies bewirkt, dass der Median für dieses Feld variabler ist als für das quadratische Feld, da dieses Feld in der Mitte so viel niedriger ist.

Kurz gesagt, wenn wir die Position des Medians in Bezug auf die Fläche (links und rechts) messen , bleibt die ursprüngliche Analyse (für ein quadratisches Kästchen) unverändert. Die Form des Kastens erschwert die Verteilung nur, wenn wir darauf bestehen, den Median in Bezug auf seine horizontale Position zu messen. Wenn wir dies tun, ist die Beziehung zwischen der Flächen- und der Positionsdarstellung umgekehrt proportional zur Höhe des Kastens.

Aus diesen Bildern kann man noch mehr lernen. Es ist klar, dass, wenn sich nur wenige Atome in (beiden) Kisten befinden, die Wahrscheinlichkeit größer ist, dass sich die Hälfte von ihnen versehentlich zu beiden Seiten gruppiert. Mit zunehmender Anzahl der Atome nimmt das Potenzial für ein derart extremes Ungleichgewicht ab. Um dies zu verfolgen, nahm ich "Filme" - eine lange Serie von 5000 Bildern - für die gebogene Box, die mit , dann mit , dann mit und schließlich mit Atomen gefüllt war , und notierte die Mediane. Hier sind Histogramme der Medianpositionen: $3$ $15$ $75$ $375$

Figur 3

Es ist klar, dass bei einer ausreichend großen Anzahl von Atomen die Verteilung ihrer Medianposition glockenförmig erscheint und enger wird: Das sieht nach einem Ergebnis des zentralen Grenzwertsatzes aus, nicht wahr?

Quantitative Ergebnisse

Die "Box" zeigt natürlich die Wahrscheinlichkeitsdichte einiger Verteilungen: Oben ist der Graph der Dichtefunktion (PDF). Somit repräsentieren Bereiche Wahrscheinlichkeiten. Das zufällige und unabhängige Platzieren von Punkten in einer Box und das Beobachten ihrer horizontalen Positionen ist eine Möglichkeit, eine Stichprobe aus der Verteilung zu ziehen. (Dies ist die Idee, die hinter der Ablehnungsabtastung steht. ) $n$

Die nächste Abbildung verbindet diese Ideen.

Figur 4

Das sieht kompliziert aus, ist aber recht einfach. Es gibt hier vier verwandte Grundstücke:

Das obere Diagramm zeigt das PDF einer Verteilung zusammen mit einer Zufallsstichprobe der Größe . Werte, die größer als der Median sind, werden als weiße Punkte angezeigt. Werte kleiner als der Median als schwarze Punkte. Es braucht keine vertikale Skala, da wir wissen, dass die Gesamtfläche Einheit ist. $n$
Das mittlere Diagramm ist die kumulative Verteilungsfunktion für dieselbe Verteilung: Es verwendet die Höhe , um die Wahrscheinlichkeit zu bezeichnen. Es teilt seine horizontale Achse mit dem ersten Plot. Die vertikale Achse muss von nach da sie Wahrscheinlichkeiten darstellt. $0$ $1$
Der linke Plot soll seitwärts gelesen werden: Es ist das PDF der Beta- Distribution . Es wird gezeigt, wie sich der Median in der Box ändert, wenn der Median in Bezug auf die Bereiche links und rechts von der Mitte gemessen wird (anstatt anhand der horizontalen Position gemessen zu werden). Ich habe aus dieser PDF-Datei wie gezeigt zufällige Punkte gezogen und diese mit horizontalen gestrichelten Linien mit den entsprechenden Stellen auf der Original-CDF verbunden: So werden Volumina (links gemessen) in Positionen (oben, in der Mitte gemessen) konvertiert und untere Grafik). Einer dieser Punkte entspricht tatsächlich dem im oberen Diagramm gezeigten Median; Ich habe eine durchgezogene vertikale Linie gezeichnet, um das zu zeigen. $(n/2+1, n/2+1)$ $16$
Das untere Diagramm ist die Abtastdichte des Medians, gemessen an seiner horizontalen Position. Sie wird erhalten, indem der Bereich (im linken Diagramm) in die Position konvertiert wird. Die Umrechnungsformel ergibt sich aus der Inversen der ursprünglichen CDF: Dies ist einfach die Definition der inversen CDF! (Mit anderen Worten, die CDF wandelt die Position in einen Bereich nach links um; die inverse CDF wandelt die Position von Bereich zu Bereich zurück.) Ich habe vertikale gestrichelte Linien gezeichnet, die zeigen, wie die zufälligen Punkte aus dem linken Diagramm in zufällige Punkte innerhalb des unteren Diagramms umgewandelt werden . Dieser Prozess des Hin- und Herlesens zeigt uns, wie wir von einem Bereich zu einer anderen Position gelangen.

Sei die CDF der Originalverteilung (mittlerer Plot) und die CDF der Beta-Verteilung. Um die Wahrscheinlichkeit zu ermitteln, dass der Median links von einer Position , verwenden Sie zuerst , um den Bereich links von im Feld zu erhalten: Dies ist selbst. Die Beta - Verteilung auf der linken Seite sagt uns die Chance , dass die Hälfte der Atome innerhalb dieses Volumens liegen wird, so dass : Dies ist die CDF der mittleren Position . Um das PDF zu finden (wie im unteren Diagramm gezeigt), nehmen Sie die Ableitung: $F$ $G$ $x$ $F$ $x$ $F(x)$ $G(F(x))$

\frac{d}{d x} G (F (x)) = G^{'} (F (x)) F^{'} (x) = g (F (x)) f (x)

$\frac{d}{dx}G(F(x)) = G'(F(x))F'(x) = g(F(x))f(x)$

Dabei ist die PDF-Datei (oberes Diagramm) und die Beta-PDF-Datei (linkes Diagramm). $f$ $g$

Dies ist eine genaue Formel für die Verteilung des Medians für jede kontinuierliche Verteilung. (Mit etwas Sorgfalt bei der Interpretation kann es auf jede beliebige Verteilung angewendet werden, ob kontinuierlich oder nicht.)

Asymptotische Ergebnisse

Wenn sehr groß ist und keinen Sprung im Median hat, muss der Stichprobenmedian eng um den wahren Median der Verteilung variieren . Unter der Annahme, dass das PDF in der Nähe von ; stetig ist , ändert sich in der vorhergehenden Formel nicht wesentlich von seinem Wert bei , der durch Darüber hinaus ändert sich auch dort nicht wesentlich von seinem Wert: auf erste Ordnung, $n$ $F$ $\mu$ $f$ $\mu$ $f(x)$ $\mu,$ $f(\mu).$ $F$

F (x) = F (μ + (x - μ)) \approx F (μ) + F^{'} (μ) (x - μ) = 1 / 2 + f (μ) (x - μ) .

$F(x) = F\left(\mu + (x-\mu)\right) \approx F(\mu) + F^\prime(\mu)(x-\mu) = 1/2 + f(\mu)(x-\mu).$

Mit einer sich ständig verbessernden Näherung, wenn groß wird, $n$

g (F (x)) f (x) \approx g (1 / 2 + f (μ) (x - μ)) f (μ) .

$g(F(x))f(x) \approx g\left(1/2 + f(\mu)(x-\mu)\right) f(\mu).$

Dies ist lediglich eine Verschiebung der Position und des Umfangs der Beta-Distribution. Die Neuskalierung durch dividiert die Varianz durch (die besser ungleich Null sein sollte!). Übrigens ist die Varianz von Beta sehr nahe an . $f(\mu)$ $f(\mu)^2$ $(n/2+1, n/2+1)$ $n/4$

Diese Analyse kann als Anwendung der Delta-Methode angesehen werden .

Schließlich ist Beta für großes ungefähr normal . Es gibt viele Möglichkeiten, dies zu sehen. Am einfachsten ist es vielleicht, den Logarithmus der PDF-Datei in der Nähe von : $(n/2+1, n/2+1)$ $n$ $1/2$

\log (C (1 / 2 + x)^{n / 2} (1 / 2 - x)^{n / 2}) = \frac{n}{2} \log (1 - 4 x^{2}) + C^{'} = C^{'} - 2 n x^{2} + O (x^{4}) .

$\log\left(C(1/2 + x)^{n/2}(1/2-x)^{n/2}\right) = \frac{n}{2}\log\left(1-4x^2\right) + C' = C'-2nx^2 +O(x^4).$

(Die Konstanten und normalisieren lediglich die Gesamtfläche auf Eins.) Durch die dritte Ordnung in ist dies dasselbe wie das Protokoll der normalen PDF mit der Varianz (Dieses Argument wird durch die Verwendung charakteristischer oder kumulativer Generierungsfunktionen anstelle des Protokolls der PDF-Datei verschärft.) $C$ $C'$ $x,$ $1/(4n).$

Wenn wir dies zusammenfassen, schließen wir daraus

Die Verteilung des Stichprobenmedians hat eine Varianz von ungefähr . $1/(4 n f(\mu)^2)$
und es ist ungefähr normal für große , $n$
alles vorausgesetzt die PDF ist stetig und ungleich Null im Median $f$ $\mu.$

whuber
quelle

Ich mag die 4. Figur. Hast du es mit R geschafft?

EngrStudent

@Engr Ich hätte wahrscheinlich einen solchen erstellen können R, vielleicht mit layout, aber tatsächlich wurde er mit Mathematica 9 durchgeführt.

whuber

1

Es ist eine Sache von Schönheit.

EngrStudent

@whuber ist es nicht Beta (n / 2 + 1, n / 2 + 1) unter Beta (1,1) vor? Siehe z. B. ine.pt/revstat/pdf/rs080204.pdf

Tim

1

@Tim Ich verstehe die Relevanz des Verweises auf eine frühere Version nicht, aber ich freue mich, dass Sie darauf hinweisen, dass der korrekte Name der im Abschnitt "Intuition" angegebenen Beta-Distribution Beta . Ich werde das beheben, wo immer es auftritt (was an mehreren Stellen in der Diskussion steht).

(n / 2 + 1, n / 2 + 1)

$(n/2+1,n/2+1)$

Whuber

18

Die leuchtende Antwort von @EngrStudent sagt uns, dass wir unterschiedliche Ergebnisse erwarten sollten, wenn die Verteilung stetig und diskret ist (die "roten" Graphen, bei denen die asymptotische Verteilung des Stichprobenmedians nicht spektakulär normal aussieht, entsprechen den Binomialverteilungen (3), Geometrisch (11), Hypergeometrisch (12), Negatives Binom (14), Poisson (18), Diskrete Uniform (22).

Und in der Tat ist dies der Fall. Wenn die Verteilung diskret ist, werden die Dinge kompliziert. Ich werde den Beweis für den Fall der absoluten Kontinuität erbringen und im Wesentlichen nur die bereits von @Glen_b gegebene Antwort detaillieren. Dann werde ich ein wenig darüber diskutieren, was passiert, wenn die Verteilung diskret ist, und außerdem eine aktuelle Referenz für alle, die sich für Tauchen interessieren im.

ABSOLUT KONTINUIERLICHE VERTRIEBUNG
Betrachten Sie eine Sammlung von absolut kontinuierlichen Zufallsvariablen mit Verteilungsfunktion (cdf) und Dichtefunktion . Definiere wobei die Indikatorfunktion ist. Daher ist ein Bernoulli rv mit $\{X_1,...X_n\}$ $F_X(x) = P(X_i\le x)$ $F'_X(x)=f_X(x)$ $Z_i\equiv I\{X_i\le x\}$ $I\{\}$ $Z_i$

E (Z_{i}) = E (I {X_{i} \leq x}) = P (X_{i} \leq x) = F_{X} (x), Var (Z_{i}) = F_{X} (x) [1 - F_{X} (x)], \forall i

$E(Z_i) = E\left(I\{X_i\le x\}\right) = P(X_i\le x)=F_X(x),\;\; \text{Var}(Z_i) = F_X(x)[1-F_X(x)],\;\; \forall i$

Sei der Stichprobenmittelwert dieser iid Bernoullis, definiert für festes als was bedeutet, dass Der zentrale Grenzwertsatz gilt und wir haben $Y_n(x)$ $x$

Y_{n} (x) = \frac{1}{n} \sum_{i = 1}^{n} Z_{i}

$Y_n(x) = \frac 1n\sum_{i=1}^nZ_i$

E [Y_{n} (x)] = F_{X} (x), Var (Y_{n} (x)) = (1 / n) F_{X} (x) [1 - F_{X} (x)]

$E[Y_n(x)] = F_X(x),\;\; \text{Var}(Y_n(x)) = (1/n)F_X(x)[1-F_X(x)]$

\sqrt{n} (Y_{n} (x) - F_{X} (x)) \to_{d} N (0, F_{X} (x) [1 - F_{X} (x)])

$\sqrt n\Big(Y_n(x) - F_X(x)\Big) \rightarrow_d \mathbb N\left(0,F_X(x)[1-F_X(x)]\right)$

Man beachte, dass dh nichts anderes als die empirische Verteilungsfunktion. Durch Anwendung der "Delta-Methode" erhalten wir für eine stetige und differenzierbare Funktion mit einer Ableitung ungleich Null am interessierenden Punkt $Y_n(x) = \hat F_n(x)$ $g(t)$ $g'(t)$

\sqrt{n} (g [{\hat{F}}_{n} (x)] - g [F_{X} (x)]) \to_{d} N (0, F_{X} (x) [1 - F_{X} (x)] \cdot {(g^{'} [F_{X} (x)])}^{2})

$\sqrt n\Big(g[\hat F_n(x)] - g[F_X(x)]\Big) \rightarrow_d \mathbb N\left(0,F_X(x)[1-F_X(x)]\cdot\left(g'[F_X(x)]\right)^2\right)$

Wählen Sie nun wobei die Umkehrfunktion bezeichnet. Dies ist eine stetige und differenzierbare Funktion (da ist), und das haben wir durch das Inverse Function Theorem $g(t) \equiv F^{-1}_X(t),\;\; t\in (0,1)$ $^{-1}$ $F_X(x)$

g^{'} (t) = \frac{d}{d t} F_{X}^{- 1} (t) = \frac{1}{f_{x} (F_{X}^{- 1} (t))}

$g'(t)=\frac {d}{dt}F^{-1}_X(t) = \frac 1{f_x\left(F^{-1}_X(t)\right)}$

Einfügen dieser Ergebnisse auf in das von der Delta-Methode abgeleitete asymptotische Ergebnis $g$

\sqrt{n} (F_{X}^{- 1} ({\hat{F}}_{n} (x)) - F_{X}^{- 1} (F_{X} (x))) \to_{d} N (0, \frac{F_{X} (x) [1 - F_{X} (x)]}{{[f_{x} (F_{X}^{- 1} (F_{X} (x)))]}^{2}})

$\sqrt n\Big(F^{-1}_X(\hat F_n(x)) - F^{-1}_X(F_X(x))\Big) \rightarrow_d \mathbb N\left(0,\frac {F_X(x)[1-F_X(x)]}{\left[f_x\left(F^{-1}_X(F_X(x))\right)\right]^2} \right)$

und Vereinfachung,

\sqrt{n} (F_{X}^{- 1} ({\hat{F}}_{n} (x)) - x) \to_{d} N (0, \frac{F_{X} (x) [1 - F_{X} (x)]}{{[f_{x} (x)]}^{2}})

$\sqrt n\Big(F^{-1}_X(\hat F_n(x)) - x\Big) \rightarrow_d \mathbb N\left(0,\frac {F_X(x)[1-F_X(x)]}{\left[f_x(x)\right]^2} \right)$

..für jedes feste . Setzen Sie nun , den (wahren) Median der Bevölkerung. Dann haben wir und das obige allgemeine Ergebnis wird für unseren interessierenden Fall $x$ $x=m$ $F_X(m) = 1/2$

\sqrt{n} (F_{X}^{- 1} ({\hat{F}}_{n} (m)) - m) \to_{d} N (0, \frac{1}{{[2 f_{x} (m)]}^{2}})

$\sqrt n\Big(F^{-1}_X(\hat F_n(m)) - m\Big) \rightarrow_d \mathbb N\left(0,\frac {1}{\left[2f_x(m)\right]^2} \right)$

Aber konvergiert gegen den Stichprobenmedian . Das ist weil $F^{-1}_X(\hat F_n(m))$ $\hat m$

F_{X}^{- 1} ({\hat{F}}_{n} (m)) = inf {x : F_{X} (x) \geq {\hat{F}}_{n} (m)} = inf {x : F_{X} (x) \geq \frac{1}{n} \sum_{i = 1}^{n} I {X_{i} \leq m}}

$F^{-1}_X(\hat F_n(m)) = \inf\{x : F_X(x) \geq \hat F_n(m)\} = \inf\{x : F_X(x) \geq \frac 1n \sum_{i=1}^n I\{X_i\leq m\}\}$

Die rechte Seite der Ungleichung konvergiert gegen und das kleinste für das schließlich , ist der Stichprobenmedian. $1/2$ $x$ $F_X \geq 1/2$

So erhalten wir

\sqrt{n} (\hat{m} - m) \to_{d} N (0, \frac{1}{{[2 f_{x} (m)]}^{2}})

$\sqrt n\Big(\hat m - m\Big) \rightarrow_d \mathbb N\left(0,\frac {1}{\left[2f_x(m)\right]^2} \right)$ das ist die Zentrale Grenzwertsatz für den Stichprobenmedian für absolut kontinuierliche Verteilungen.

DISCRETE DISTRIBUTIONS
Wenn die Verteilung diskret ist (oder wenn die Stichprobe Verbindungen enthält), wurde argumentiert, dass die "klassische" Definition von Stichprobenquantilen und damit auch des Medians als theoretisches Konzept in erster Linie irreführend sein kann verwendet, um zu messen, was man versucht, durch Quantile zu messen.
In jedem Fall wurde simuliert, dass unter dieser klassischen Definition (die wir alle kennen) die asymptotische Verteilung des Stichprobenmedians nicht normal und eine diskrete Verteilung ist.

Eine alternative Definition von Stichprobenquantilen erfolgt unter Verwendung des Konzepts der "Mittelverteilungs" -Funktion, die definiert ist als

F_{m i d} (x) = P (X \leq x) - \frac{1}{2} P (X = x)

$F_{mid}(x) = P(X\le x) - \frac 12P(X=x)$

Die Definition von Stichprobenquantilen durch das Konzept der Mittelverteilungsfunktion kann als Verallgemeinerung angesehen werden, die als Sonderfälle die stetigen Verteilungen, aber auch die nicht so stetigen Verteilungen abdecken kann.

Unter anderem für den Fall diskreter Verteilungen wurde festgestellt, dass der durch dieses Konzept definierte Stichprobenmedian eine asymptotisch normale Verteilung mit einer ausgefeilten Varianz aufweist.

Die meisten davon sind aktuelle Ergebnisse. Die Referenz ist Ma, Y., Genton, MG & Parzen, E. (2011). Asymptotische Eigenschaften von Probenquantilen mit diskreten Verteilungen. Annalen des Instituts für Statistische Mathematik, 63 (2), 227-243. Hier findet man eine Diskussion und Links zur älteren einschlägigen Literatur.

Alecos Papadopoulos
quelle

2

(+1) Für den Artikel. Dies ist eine hervorragende Antwort.

Alex Williams

Können Sie bitte erklären, warum gegen den Stichprobenmedian konvergiert ?

F_{X}^{- 1} ({\hat{F}}_{n} (m))

$F^{-1}_X(\hat F_n(m))$

\hat{m}

$\hat m$

Kasa

Ich weiß, dass in der Verteilung, aber ich kann nicht sehen, wie Stichprobenmedian gleich

{\hat{F}}_{n} (m) \to F_{X} (m)

$\hat F_n(m) \to F_X(m)$

\hat{m}

$\hat m$

F_{X}^{- 1} ({\hat{F}}_{n} (m))

$F^{-1}_X(\hat F_n(m))$

kasa

1

@kasa Ich habe ein bisschen in der Sache ausgearbeitet.

Alecos Papadopoulos

Es tut mir leid, das immer wieder zu : Aber das kleinste für das schließlich , ist der Bevölkerungsmedian, nicht der Stichprobenmedian, nicht ?

x

$x$

F_{X} (x) \geq 1 / 2

$F_X(x) ≥ 1/2$

Kasa

10

Ja, nicht nur für den Median, sondern für jedes Stichprobenquantil. Ausgehend von diesem Beitrag von TS Ferguson, Professor an der UCLA (seine Seite ist hier ), der sich interessanterweise mit der gemeinsamen Verteilung von Stichprobenmittelwert und Stichprobenquantilen befasst, haben wir:

Sei sei iid mit Verteilungsfunktion , Dichte , Mittelwert und endlicher Varianz . Sei und sei das Quantil von , so dass . Es sei angenommen, dass die Dichte bei stetig und positiv . Sei das Quantil der Stichprobe . Dann $X_1, . . . ,X_n$ $F(x)$ $f(x)$ $\mu$ $\sigma^2$ $0 < p < 1$ $x_p$ $p$ $F$ $F(x_p) = p$ $f(x)$ $x_p$ $Y_n = X_{(n:\lceil np\rceil)}$ $p$

\sqrt{n} (Y_{n} - x_{p}) \overset{d}{\to} N (0, p (1 - p) / (f (x_{p}))^{2})

$\sqrt n(Y_n − x_p) \xrightarrow{d} N(0, p(1 − p)/(f(x_p))^2)$

Für (Median) und Sie haben die CLT für Mediane, $p=1/2 \Rightarrow x_p=m$

\sqrt{n} (Y_{n} - m) \overset{d}{\to} N (0, [2 f (m)]^{- 2})

$\sqrt n(Y_n − m) \xrightarrow{d} N\left(0, [2f(m)]^{-2}\right)$

Alecos Papadopoulos
quelle

1

Nett. Erwähnenswert ist, dass die Varianz des Stichprobenmedians nicht so einfach abzuschätzen ist wie die des Stichprobenmittelwerts.

Michael M

@Alecos - wie hast du zwei Antworten auf diese Frage bekommen?

EngrStudent

1

@EngrStudent Das System lässt dies zu. Es fordert Sie lediglich auf, zu bestätigen, dass Sie tatsächlich eine zweite Antwort hinzufügen möchten.

Alecos Papadopoulos

8

Ich mag die analytische Antwort von Glen_b. Das ist eine gute Antwort.

Es braucht ein Bild. Ich mag Bilder.

Hier sind Bereiche der Elastizität in einer Antwort auf die Frage:

Es gibt viele Distributionen auf der Welt. Der Kilometerstand kann variieren.
Ausreichend hat unterschiedliche Bedeutungen. Für ein Gegenbeispiel zu einer Theorie ist manchmal ein einziges Gegenbeispiel erforderlich, damit "ausreichend" erfüllt ist. Für den Nachweis niedriger Fehlerraten mit binomischer Unsicherheit können Hunderte oder Tausende von Proben erforderlich sein.

Für einen normalen Standard habe ich den folgenden MatLab-Code verwendet:

mysamples=1000;

loops=10000;

y1=median(normrnd(0,1,mysamples,loops));

cdfplot(y1)

und ich habe die folgende Handlung als Ausgabe bekommen:

Bildbeschreibung hier eingeben

Warum tun Sie dies nicht für die anderen 22 oder so "eingebauten" Verteilungen, außer wenn Sie Prob-Plots verwenden (wobei gerade Linie sehr normal bedeutet)?

Bildbeschreibung hier eingeben

Und hier ist der Quellcode dafür:

mysamples=1000;

loops=600;

y=zeros(loops,23);

y(:,1)=median(random('Normal', 0,1,mysamples,loops));

y(:,2)=median(random('beta', 5,0.2,mysamples,loops));
y(:,3)=median(random('bino', 10,0.5,mysamples,loops));
y(:,4)=median(random('chi2', 10,mysamples,loops));
y(:,5)=median(random('exp', 700,mysamples,loops));

y(:,6)=median(random('ev', 700,mysamples,loops));
y(:,7)=median(random('f', 5,3,mysamples,loops));
y(:,8)=median(random('gam', 10,5,mysamples,loops));
y(:,9)=median(random('gev', 0.24, 1.17, 5.8,mysamples,loops));
y(:,10)=median(random('gp', 0.12, 0.81,mysamples,loops));

y(:,11)=median(random('geo', 0.03,mysamples,loops));
y(:,12)=median(random('hyge', 1000,50,20,mysamples,loops));
y(:,13)=median(random('logn', log(20000),1.0,mysamples,loops));
y(:,14)=median(random('nbin', 2,0.11,mysamples,loops));
y(:,15)=median(random('ncf', 5,20,10,mysamples,loops));

y(:,16)=median(random('nct', 10,1,mysamples,loops));
y(:,17)=median(random('ncx2', 4,2,mysamples,loops));
y(:,18)=median(random('poiss', 5,mysamples,loops));
y(:,19)=median(random('rayl', 0.5,mysamples,loops));
y(:,20)=median(random('t', 5,mysamples,loops));

y(:,21)=median(random('unif',0,1,mysamples,loops));
y(:,22)=median(random('unid', 5,mysamples,loops));
y(:,23)=median(random('wbl', 0.5,2,mysamples,loops));


figure(1); clf
hold on

for i=2:23
    subplot(4,6,i-1)

    probplot(y(:,i))
    title(['Probplot of ' num2str(i)])
    axis tight

    if not(isempty(find(i==[3,11,12,14,18,22])))
        set(gca,'Color','r')
    end

end

Wenn ich den analytischen Beweis sehe, könnte ich denken, "theoretisch passen sie alle", aber wenn ich ihn ausprobiere, kann ich das mildern mit "es gibt eine Reihe von Möglichkeiten, wie dies nicht so gut funktioniert, oft mit diskreten oder stark eingeschränkten Bedingungen Werte "und dies könnte mich veranlassen, vorsichtiger zu sein, wenn ich die Theorie auf alles anwende, was Geld kostet.

Viel Glück.

EngrStudent
quelle

Liege ich falsch oder ist die Verteilung, für die der Median nicht normal verteilt ist, diskret?

SeF

Zentraler Grenzwertsatz für Stichprobenmediane

Antworten:

Intuition

Quantitative Ergebnisse

Asymptotische Ergebnisse