Vergib mir, wenn ich etwas ziemlich Offensichtliches verpasst habe.
Ich bin Physiker mit einer (Histogramm-) Verteilung, die sich um einen Mittelwert dreht, der sich einer Normalverteilung annähert. Der für mich wichtige Wert ist die Standardabweichung dieser Gaußschen Zufallsvariablen. Wie würde ich versuchen, den Fehler in der Standardabweichung der Stichprobe zu finden? Ich habe das Gefühl, dass es etwas mit dem Fehler auf jedem Bin im ursprünglichen Histogramm zu tun hat.
Antworten:
Es hört sich so an, als würden Sie nach einer Berechnung der Standardabweichung der Standardabweichung der Stichprobe fragen. Das heißt, Sie fragen nach , woSD(s)=var(s)−−−−−√
und ¯ X ist die Probe Mittelwert.X1,...,Xn∼N(μ,σ2) X¯¯¯¯
Erstens wissen wir aus den grundlegenden Eigenschaften der Varianz, dass
Da die Stichprobenvarianz unverzerrt ist, wissen wir, dass . In Warum ist die Standardabweichung der Stichprobe ein voreingenommener Schätzer von σ ? , E ( s ) wird berechnet, woraus wir schließen könnenE(s2)=σ2 σ E(s)
deshalb
quelle
Die Größe hat eine Chi-Quadrat-Verteilung mit n - 1 Freiheitsgraden, wenn die Proben unabhängig und mit derselben Normalverteilung verteilt sind. Diese Größe kann verwendet werden, um Konfidenzintervalle für die zu erhalten Varianz der Normalen und ihrer Standardabweichung. Wenn Sie die Rohwerte und nicht nur den zentralen Wert der Behälter haben, können Sie s 2 berechnen .X=(n−1)s2/σ2 n−1 s2
Es ist bekannt, dass wenn eine Chi-Quadrat-Verteilung mit n - 1 Freiheitsgraden hat, seine Varianz 2 ( n - 1 ) beträgt . Wenn wir dies und die Tatsache wissen, dass V a r ( c X ) = c 2 V a r ( X ) ist, erhalten wir, dass s 2 eine Varianz von 2 ( n - 1 ) σ 4 hatX n−1 2(n−1) Var(cX)=c2Var(X) s2 Obwohl σ 4 unbekannt ist, können Sie es mit s 4 approximierenund haben eine ungefähre Vorstellung davon, wie die Varianz von s 2 ist.
quelle
There are several ways of quantifying the error of the standard deviation in the normal case. I am going to present the profile likelihood ofσ which can be used for approximating confidence intervals.
Letx=(x1,...,xn) be a sample from a Normal(μ,σ) . The corresponding likelihood function is given by
Then, the Maximum Likelihood Estimators are given by(μ^,σ^)=(x¯,s) , where s=1n∑nj=1(xj−x¯)2−−−−−−−−−−−−−−√ . Given that you are interested on quantifying the error on σ , you can then calculate the normalised profile likelihood of this parameter as follows.
Note thatRp:R+→(0,1] . An interval of level 0.147 has an approximate confidence of 0.95 . Next I attach an R code that can be used for calculating these intervals. You can modify it accordingly in your context (or if you post the data I can include these changes).
An advantage of this sort of intervals is that they are invariant under transformations. In this case if you calculate an interval forσ , I=(L,U) , then the corresponding interval for σ2 is simply I′=(L2,U2) .
quelle