Was ist der Mittelwert und die Varianz des Medians einer Menge normaler Zufallsvariablen?

8

Sei , ..., identisch unabhängig verteilte Zufallsvariablen mitX1XnN(μ,σ2)

Es ist leicht zu zeigen, dass der Stichprobenmittelwert eine Zufallsvariable mit .X¯=1ni=0nXiN(μ,σ2n)

Es fällt mir jedoch schwer, die Verteilung des der Stichprobe zu ermitteln , insbesondere in Bezug auf Mittelwert und Varianz.median(X)

Ich frage, weil ich versuche, einige Funktionen in vordefinierten Gruppen zusammenzufassen, um die Anzahl der Tests zu verringern, die ich zwischen zwei Bedingungen durchführen muss.

Wenn es keine einfache Antwort darauf gibt, wie ich vermute, wäre ich daran interessiert, die Varianz des , insbesondere wie sie sich von .median(X)X¯

Nicolas De Jay
quelle
4
Verwandte, für asymptotische Normalität über die CLT: Zentraler Grenzwertsatz für Stichprobenmediane
Stephan Kolassa
2
Denken Sie für die Erwartung daran, dass der Median der iid-Normalen die Statistik Ordnung ist, und schauen Sie hier: Ungefähre Ordnungsstatistik für normale Zufallsvariablennn/.2
Stephan Kolassa

Antworten:

7

Der Median ist die Statistik zentraler Ordnung, wenn die Anzahl der Beobachtungen ungerade ist. Wenn ist, ist der Median entweder eine Ordnungsstatistik oder der Mittelwert aus 2 Ordnungsstatistiken (oder etwas anderem), je nachdem, welche Definition des Medians Sie verwenden.n

Die genaue Verteilung des Medians kann also anhand der Verteilung der Auftragsstatistiken ermittelt werden. Für ungerade denen alle aus einem PDF mit kumulativer Verteilung die Verteilung des Medians:nxfF.

(n- -1(n- -1)/.2)F.(x)n- -12f(x)(1- -F.(x))n- -12

Sie können "Verteilung von Auftragsstatistiken" googeln, um weitere Details und Ableitungen zu erhalten.

Normalerweise haben wir keine geschlossene Lösung für , aber es gibt Berechnungswerkzeuge, die helfen können, das Obige abzuschätzen (siehe das Distr-Paket für R für eine Möglichkeit).F.(x)

Wenn Ihr Hauptziel nur eine Schätzung der Varianz des Medians ist, besteht ein einfacherer Ansatz darin, eine Reihe von Datensätzen zu simulieren und die Varianz ihrer Mediane (und die Varianz ihrer Vergleichsmittel) zu berechnen.

Der Wikipedia-Artikel zu "Median" enthält auch Informationen, die von Interesse sein können.

Greg Snow
quelle