Demonstration der Stichprobenquantilvorspannung

8

Während einiger Simulationen wurde mir klar, dass das Probenquantil ein voreingenommener Schätzer des wahren Quantils ist. Und nach meinen Simulationen eine möglicherweise sehr voreingenommene.

Ich war von diesem Ergebnis überrascht, da die empirische CDF nicht voreingenommen ist, aber nach einigen Internetrecherchen stellte ich fest, dass es wahr ist .

Ich habe versucht herauszufinden, woher diese Verzerrung kommt, aber die Arbeit mit Stichprobenquantilen ist ziemlich schwierig. Hat jemand eine Demonstration dieser Tendenz (und im Idealfall eine Quantifizierung)?

Thomas
quelle
2
Das ECDF ist für das cdf unvoreingenommen, aber wie würden Sie vom ECDF zu einem Stichprobenquantil gelangen?
Glen_b -State Monica
3
Es gibt kein "Probenquantil". Es gibt viele Definitionen von Stichprobenquantilen. Sie müssen angeben, welche Sie meinen.
Rob Hyndman

Antworten:

3

Die Verzerrung bei der Schätzung von Quantilen wird in verteilungsfrei untersuchtp

http://www.sciencedirect.com/science/article/pii/S016771520000242X

(Ein PDF finden Sie auf derselben Seite). Die Autoren konzentrieren sich auf den Quantilschätzer basierend auf der ECDF-Inversion. Es werden keine Annahmen über die zugrunde liegende Verteilung getroffen (außer dem endlichen zweiten Moment), daher sind auch diskrete Verteilungen enthalten.

Einige Highlights:

  • σ

  • σ<σp(1- -p)n

  • np>3p- -(1- -p)/.p1- -pp/.(1- -p)

Michael M.
quelle
1

Nur um diesen alten Beitrag zu ergänzen: Der ECDF ist nur bei hohen Stichprobengrößen unvoreingenommen. Bei niedrigen Werten von N ist es vorgespannt. Nehmen Sie den trivialen Fall von N = 1 und der ECDF nimmt einen Wert von 1 bei und über dem Stichprobenwert an. Fragen Sie sich, welchen Wert die zugrunde liegende Verteilung hat, die eine Wahrscheinlichkeit von 1 ergibt.

Die Vorspannung überschreitet tatsächlich sqrt (2 · pi) / (2N) · SD oder 1,25 / N · SD, so dass dies für ein N von 5 eine Vorspannung von 0,25 SD ist.

Versuchen Sie anstelle eines auf k / N basierenden ECDF (k-0,5) / N, um einen unvoreingenommenen ECDF zu erhalten. Das könnte Ihnen unvoreingenommene Stichprobenquantile geben. Es stellt auch sicher, dass ECDF (x) = 1-ECDF (-x) ist, das von allen anderen kumulativen Verteilungen genutzt wird.

Meiner bescheidenen Meinung nach ist der ECDF, wie er definiert und verwendet wird, eine große Fehlbezeichnung. Es spannt Kolmogorov Smirnov, Lilliefors und andere Standardtests bei niedrigem N vor.

Schauen Sie sich Gilchrist "Statistische Modellierung mit Quantilfunktionen" an

user2092957
quelle
1
Das ist ein interessanter Punkt, aber technisch gesehen , die ECDF ist unvoreingenommene! Sie beziehen sich auf die Tatsache, dass Sie beispielsweise, nachdem Sie ECDF (x) = 1 gesehen haben, wissen, dass der Fehler nur ein Vorzeichen haben kann, sodass Sie eine bedingte Verzerrung der Sortierung haben. Die häufig auftretende Eigenschaft der Unparteilichkeit bezieht sich jedoch auf die Situation, bevor Daten angezeigt werden, und nicht auf die bedingte Verzerrung, auf die Sie sich beziehen.
kjetil b halvorsen
0

Es gibt eine eindeutige Quantildefinition für echte Stichproben (die normalerweise nicht dargestellt wird). Siehe: http://dx.doi.org/10.1155/2014/326579

user153836
quelle
Der Artikel ist interessant, aber viele Leser würden von einer Zusammenfassung der Argumente profitieren und warum die vielen vorhandenen Definitionen falsch sind.
Mdewey