Warum ist die Standardabweichung der Stichprobe ein verzerrter Schätzer von

57

Nach dem Wikipedia-Artikel über unvoreingenommene Schätzung der Standardabweichung der Stichprobe SD

s=1n-1ich=1n(Xich-X¯)2

ist ein voreingenommener Schätzer der SD der Bevölkerung. Es besagt, dassE(s2)E(s2) .

NB. Zufallsvariablen sind unabhängig und jedesXichN(μ,σ2)

Meine Frage ist zweifach:

  • Was ist der Beweis für die Voreingenommenheit?
  • Wie berechnet man die Erwartung der Probenstandardabweichung?

Meine Kenntnisse in Mathe / Statistik sind nur mittelschwer.

Dav Weps
quelle
4
Sie finden beide Fragen im Wikipedia-Artikel über die Chi-Distribution .
whuber

Antworten:

57

Die Antwort von @ NRH auf diese Frage liefert einen schönen, einfachen Beweis für die Voreingenommenheit der Standardabweichung der Stichprobe. Hier werde ich explizit die Erwartung der Standardabweichung der Stichprobe (die zweite Frage des ursprünglichen Posters) von einer normalverteilten Stichprobe berechnen, wobei an diesem Punkt die Verzerrung klar ist.

Die unvoreingenommene Probenvarianz eines Satzes von Punkten ist ,x1,...,xn

s2=1n1i=1n(xix¯)2

Wenn die normal verteilt sind, ist es eine Tatsache, dassxi

(n1)s2σ2χn12

wobei die wahre Varianz ist. Die χ 2 k- Verteilung hat eine Wahrscheinlichkeitsdichteσ2χk2

p(x)=(1/2)k/2Γ(k/2)xk/21ex/2

daraus können wir den erwarteten Wert von ableiten ;s

E(s)=σ2n1E(s2(n1)σ2)=σ2n10x(1/2)(n1)/2Γ((n1)/2)x((n1)/2)1ex/2 dX

was sich aus der Definition des Erwartungswertes und der Tatsache ergibt, dass ist die Quadratwurzel einerχ2verteilten Variablen. Der Trick besteht nun darin, Terme neu anzuordnen, damit der Integrand eine weitereDichte vonχ2erhält:s2(n1)σ2χ2χ2

E(s)=σ2n10(1/2)(n1)/2Γ(n12)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)0(1/2)(n1)/2Γ(n/2)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)(1/2)(n1)/2(1/2)n/20(1/2)n/2Γ(n/2)x(n/2)1ex/2 dxχn2 density

χn2

E(s)=σ2n1Γ(n/2)Γ(n12)

s

σE(s)=σ(12n1Γ(n/2)Γ(n12))σ4n
n .

nnσ=11/4n

Bildbeschreibung hier eingeben

Makro
quelle
(4n)1
Sie haben sich wirklich sehr viel Mühe gegeben, um dieses Makro zu erstellen. Als ich den Post vor ungefähr einer Minute zum ersten Mal sah, dachte ich daran, die Voreingenommenheit mit Jensens Regel zu zeigen, aber jemand tat es bereits.
Michael Chernick
2
Natürlich ist dies ein Umweg, um zu zeigen, dass die Standardabweichung voreingenommen ist. Ich beantwortete hauptsächlich die zweite Frage des ursprünglichen Posters: "Wie berechnet man die Erwartung der Standardabweichung?".
Makro
2
sσk
2
skk
43

s2=1n1i=1n(xix¯)2
σ2
E(s2)<E(s2)=σ
s2σ2
NRH
quelle
19

nehme an, dass

Sn=i=1n(XiX¯n)2n1,
SnVar[Sn]0
0<Var[Sn]=E[Sn2]E2[Sn]E2[Sn]<E[Sn2]E[Sn]<E[Sn2]=σ.
Zen
quelle