Dies ist eine allgemeinere Behandlung des Problems, das durch diese Frage aufgeworfen wird . Nachdem wir die asymptotische Verteilung der Stichprobenvarianz abgeleitet haben, können wir die Delta-Methode anwenden, um die entsprechende Verteilung für die Standardabweichung zu erhalten.
Lassen Sie eine Stichprobe der Größe von iid nicht normalen Zufallsvariablen { X i } , , mit Mittelwertund Varianz. Stellen Sie den Stichprobenmittelwert und die Stichprobenvarianz als
Wir wissen, dass
wo , und wir beschränken unsere Aufmerksamkeit auf Verteilungen, für die welche Momente existieren und endlich sein müssen, existieren und endlich sind.
Hält es das?
mathematical-statistics
variance
central-limit-theorem
asymptotics
Alecos Papadopoulos
quelle
quelle
Antworten:
Um Abhängigkeiten zu umgehen, die sich bei der Betrachtung der Stichprobenvarianz ergeben, schreiben wir
und nach einer kleinen Manipulation,
Deshalb
Manipulieren,
Der Term wird asymptotisch zu Eins. Der Begriff √n/(n−1) ist determinitisch und geht alsn→∞auf Null.n√n−1σ2 n→∞
Wir haben auch . Die erste Komponente konvergiert in der Verteilung gegen eine Normale, die zweite konvergiert in der Wahrscheinlichkeit gegen Null. Dann konvergiert das Produkt nach dem Satz von Slutsky mit der Wahrscheinlichkeit gegen Null,n−−√(x¯−μ)2=[n−−√(x¯−μ)]⋅(x¯−μ)
Wir sind mit dem Begriff verlassen
Anhand eines tödlichen Beispiels von @whuber in einem Kommentar zu dieser Antwort möchten wir sicherstellen , dass nicht konstant ist. Whuber darauf hingewiesen , dass , wenn X i ein Bernoulli ( 1 / 2 ) , dann diese Größe eine Konstante ist. Ausgenommen also Variablen, für die dies der Fall ist (vielleicht andere dichotome, nicht nur 0 / 1- Binärvariablen?), Für den Rest haben wir(Xi−μ)2 Xi (1/2) 0/1
und so ist der untersuchte Begriff ein üblicher Gegenstand des klassischen zentralen Grenzwertsatzes, und
Hinweis: Das obige Ergebnis gilt natürlich auch für normalverteilte Stichproben. In diesem letzten Fall steht jedoch auch ein Chi-Quadrat-Verteilungsergebnis mit endlichen Stichproben zur Verfügung.
quelle
Sie haben bereits eine detaillierte Antwort auf Ihre Frage, aber lassen Sie mich eine andere dazu anbieten. Tatsächlich ist ein kürzerer Beweis aufgrund der Tatsache möglich, dass die Verteilung von
does not depend onE(X)=ξ , say. Asymptotically, it also does not matter whether we change the factor 1n−1 to 1n , which I will do for convenience. We then have
And now we assume without loss of generality thatξ=0 and we notice that
has probability limit zero, since the second term is bounded in probability (by the CLT and the continuous mapping theorem), i.e. it isOp(1) . The asymptotic result now follows from Slutzky's theorem and the CLT, since
whereτ2=Var{X2}=E(X4)−(E(X2))2 . And that will do it.
quelle
Die hervorragenden Antworten von Alecos und JohnK ergeben bereits das gewünschte Ergebnis, aber ich möchte noch etwas zur asymptotischen Verteilung der Stichprobenvarianz sagen.
Es ist üblich, asymptotische Ergebnisse unter Verwendung der Normalverteilung darzustellen, und dies ist nützlich, um die Theoreme zu formulieren. Praktisch gesehen besteht der Zweck einer asymptotischen Verteilung für eine Stichprobenstatistik darin, dass Sie eine ungefähre Verteilung erhalten, wennn ist groß. Sie können eine Vielzahl von Optionen für Ihre Annäherung an große Stichproben auswählen, da viele Verteilungen dieselbe asymptotische Form haben. Im Falle der Stichprobenvarianz ist meiner Meinung nach eine hervorragende Approximationsverteilung für großn wird gegeben durch:
whereDFn≡2/V(S2n/σ2)=2n/(κ−(n−3)/(n−1)) and κ=μ4/σ4 is the kurtosis parameter. This distribution is asymptotically equivalent to the normal approximation derived from the theorem (the chi-squared distribution converges to normal as the degrees-of-freedom tends to infinity). Despite this equivalence, this approximation has various other properties you would like your approximating distribution to have:
Unlike the normal approximation derived directly from the theorem, this distribution has the correct support for the statistic of interest. The sample variance is non-negative, and this distribution is has non-negative support.
In the case where the underlying values are normally distributed, this approximation is actually the exact sampling distribution. (In this case we haveκ=3 which gives DFn=n−1 , which is the standard form used in most texts.) It therefore constitutes a result that is exact in an important special case, while still being a reasonable approximation in more general cases.
Derivation of the above result: Approximate distributional results for the sample mean and variance are discussed at length in O'Neill (2014), and this paper provides derivations of many results, including the present approximating distribution.
This derivation starts from the limiting result in the question:
Re-arranging this result we obtain the approximation:
Da die Chi-Quadrat-Verteilung asymptotisch normal ist, wieD F→ ∞ wir haben:
NehmenD Fn≤ 2 / V ( S2n/ σ2) (was die obige Formel ergibt) ergibt D Fn→ 2 n / ( κ - 1 ) Dies stellt sicher, dass die Chi-Quadrat-Verteilung asymptotisch der normalen Approximation aus dem Grenzwertsatz entspricht.
quelle