Konfidenzintervall für den Median

8

Ich habe eine Reihe von Werten von denen ich den Median M berechne. Ich habe mich gefragt, wie ich den Fehler bei dieser Schätzung berechnen kann.xich,ich=1,,N.

Im ich festgestellt, dass es als berechnet werden kann, wobei die Standardabweichung ist. Aber ich habe keine Hinweise darauf gefunden. Also verstehe ich nicht warum .. Könnte mir jemand das erklären?1,2533σN.σ

Ich dachte, ich könnte Bootstrap verwenden, um eine Schätzung des Fehlers zu erhalten, aber ich möchte dies vermeiden, da dies meine Analyse erheblich verlangsamen würde.

Ich dachte auch daran, den Fehler auf dem Median auf diese Weise zu berechnen

δM.=ich(xich- -M.)2N.- -1

Macht das Sinn?

Shamalaia
quelle
1
Wissen Sie mit absoluter Sicherheit, dass die Daten normal verteilt sind?
Gung - Reinstate Monica
sie sind lognormal
shamalaia
4
Bootstrap sollte funktionieren und es konnte nicht lange dauern. Entweder haben Sie einen ausreichend vollständigen Datensatz und müssen keinen Bootstrap durchführen. Nehmen Sie einfach den Median Ihrer Variablen als gute Schätzung des realen Medians. Oder Sie haben einen eher kleinen Datensatz und können mithilfe von Bootstrap einen Median mit Ihrem Margin-Fehler in kürzester Zeit schätzen.
YCR
2
Ausführliche Informationen zur Verteilung des Medians finden Sie in meinem Beitrag unter stats.stackexchange.com/a/86804/919 . Es entwickelt die Theorie, die sowohl für nichtparametrische als auch für Konfidenzintervalle mit normaler Approximation benötigt wird.
whuber

Antworten:

12

Um Fehler im Median direkt zu behandeln, können Sie das genaue nichtparametrische Konfidenzintervall für den Median verwenden, das Auftragsstatistiken verwendet. Wenn Sie etwas anderes wollen, dh ein Maß für die Streuung, berücksichtigen Sie Ginis mittleren Unterschied. Der Code ist hier für das Konfidenzintervall des Medians.

Frank Harrell
quelle
S.n=cmedj(medj|xich- -xj|)
1
Der Median muss einen asymmetrischen Fehler aufweisen, wenn die Datenverteilung asymmetrisch ist.
Frank Harrell
11

Wie in der anderen Antwort ausgeführt, gibt es ein nicht parametrisches CI für den Median unter Verwendung der Auftragsstatistik. Dieses CI ist in vielerlei Hinsicht besser als das, was Sie im Internet gefunden haben.

1,2533σN.θ~θ

n(θ~- -θ)L.N.(0,14[f(θ)]]2)

f[f(θ)]]2θσ2f

[f(θ)]]2=12πσ2

und so wird die asymptotische Varianz

2π4σ2

N.1,2533σN.

JohnK
quelle
jetzt in Wikipedia: en.wikipedia.org/wiki/Median#Sampling_distribution
Felipe G. Nievinski