Sie können alles finden hier . Hier ist jedoch eine kurze Antwort.
Sei und der Mittelwert und die Varianz von Interesse; Sie möchten basierend auf einer Stichprobe der Größe schätzen .σ 2 σ 2 nμσ2σ2n
Angenommen, Sie verwenden den folgenden Schätzer:
S2= 1n∑ni = 1( Xich- X¯)2 ,
Dabei ist der Schätzer von .μX¯= 1n∑ni = 1Xichμ
Es ist nicht allzu schwierig (siehe Fußnote) zu sehen, dass .E[ S2] = n - 1nσ2
Da , wird der Schätzer als vorgespannt bezeichnet.S 2E[ S2] ≠ σ2S2
Beachten Sie jedoch, dass . Daher ist ein unverzerrter Schätzer von . ≤ S 2=nE[ nn - 1S2] = σ2σ2S~2= nn - 1S2σ2
Fußnote
Schreiben Sie zunächst und erweitern Sie dann das Produkt ...( Xich- X¯)2= ( ( Xich- μ ) + ( μ - X¯) )2
Bearbeiten Sie, um Ihre Kommentare zu berücksichtigen
Der erwartete Wert von ergibt nicht (und daher ist voreingenommen), aber es stellt sich heraus, dass Sie in transformieren können, sodass die Erwartung ergibt .σ 2 S 2 S 2 ≤ S 2 σ 2S2σ2S2S2S~2σ2
In der Praxis arbeitet man oft lieber mit mit . Wenn jedoch groß genug ist, ist dies kein großes Problem, da .S2nnS~2S2nnn - 1≈ 1
Anmerkung Beachten Sie, dass Unparteilichkeit eine Eigenschaft eines Schätzers und nicht einer Erwartung ist, wie Sie geschrieben haben.
Diese Antwort verdeutlicht die Antwort von Ocram. Der Hauptgrund (und häufiges Missverständnis) für ist, dass die Schätzung die selbst aus Daten geschätzt wird.S 2 ≤ XE[ S2] ≠ σ2 S2 X¯
Wenn Sie die Ableitung durcharbeiten, werden Sie sehen, dass die Varianz dieser Schätzung genau das ist, was den zusätzlichen Term ergibt- σ 2E[ ( X¯- μ )2] - σ2n
quelle
Die Erklärung, die @Ocram gab, ist großartig. Um zu erklären, was er in Worten gesagt hat: Wenn wir durch Division durch berechnen (was intuitiv ist), wird unsere Schätzung von unterschätzt. Zum Ausgleich dividieren wir durch . n s 2 n - 1s2 n s2 n - 1
Hier ist eine Übung: Bilden Sie eine diskrete Wahrscheinlichkeit mit 2 Ergebnissen, sagen Sie und . Finden Sie und für diese Distribution. Berechnen Sie und für den Stichprobenmittelwert, wenn . Berechnen Sie alle möglichen Stichproben der Größe . Berechnen Sie über diese Samples und wenden Sie die entsprechenden Frequenzen an. P ( 6 ) = 0,75 μ σ μ σ n = 3 n = 3 s 2P( 2 ) = 0,25 P( 6 ) = 0,75 μ σ μ σ n=3 n=3 s2
Manchmal muss man sich die Hände schmutzig machen.
quelle
Im Allgemeinen ergibt die Verwendung von "n" im Nenner kleinere Werte als die Populationsvarianz, die wir schätzen möchten. Dies ist insbesondere dann der Fall, wenn die kleinen Proben entnommen werden. In der Sprache der Statistik sagen wir, dass die Stichprobenvarianz eine "voreingenommene" Schätzung der Populationsvarianz liefert und "unvoreingenommen" gemacht werden muss.
Dieses Video beantwortet jeden Teil Ihrer Frage angemessen.
https://www.youtube.com/watch?v=xslIhnquFoE
quelle