Wie können wir eine Normalverteilung als

12

Angenommen, wir haben eine Zufallsvariable mit einem Wertebereich, der durch a und b , wobei a der Minimalwert und b der Maximalwert ist.

Mir wurde gesagt , dass als n , wobei n ist unsere Stichprobengröße, die Stichprobenverteilung unserer Stichprobe Mittel ist eine Normalverteilung. Das heißt, wenn wir erhöhen, nähernn wir uns einer Normalverteilung immer mehr, aber die tatsächliche Grenze als n ist gleich einer Normalverteilung.

Ist dies jedoch nicht Teil der Definition der Normalverteilung, die von nach ?

Wenn das Maximum unseres Bereichs b , ist der maximale Stichprobenmittelwert (unabhängig von der Stichprobengröße) gleich b und der minimale Stichprobenmittelwert gleich a .

Selbst wenn wir die Grenze nehmen, während unendlich geht, ist unsere Verteilung meines Erachtens keine tatsächliche Normalverteilung, da sie durch a und b begrenzt ist .nab

Was bin ich ?

Jeremy Radcliff
quelle

Antworten:

15

Hier ist, was Sie vermissen. Die asymptotische Verteilung beträgt nicht X¯n (Mittelwert der Stichprobe), sondern , wobeiθn(X¯nθ)θ der Mittelwert von .X

Sei eine Zufallsvariable, so dass a < X i < b und X i den Mittelwert θ und die Varianz σ 2 haben . Also X iX1,X2,a<Xi<bXiθσ2Xi die Unterstützung begrenzt. Das CLT sagt, dass

n(X¯nθ)dN(0,σ2),

wobei der Stichprobenmittelwert ist. JetztX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

Als tendieren die Untergrenze und die Obergrenze zu - bzw. und somit zu n nn Unterstützung von ist genau die ganze reelle Linie.n(X¯nθ)

Wann immer wir die CLT in der Praxis verwenden, sagen wir , und dies wird immer eine Annäherung sein.X¯nN(θ,σ2/n)


EDIT: Ich denke, ein Teil der Verwirrung beruht auf der Fehlinterpretation des zentralen Grenzwertsatzes. Sie haben Recht, dass die Stichprobenverteilung des Stichprobenmittelwerts

X¯nN(θ,σ2/n).

Die Stichprobenverteilung ist jedoch eine Eigenschaft endlicher Stichproben. Wie Sie sagten, wollen wir ; Sobald wir dies tun, ist das ≈- Zeichen ein genaues Ergebnis. Wenn wir jedoch n ∞ lassen , können wir kein n mehr auf der rechten Seite haben (da n jetzt ∞ ist ). Die folgende Aussage ist also falsch ˉ X n d N ( θ , σ 2 / n )  als  n .nnnn

X¯ndN(θ,σ2/n) as n.

[Hier steht für Konvergenz in Bezug auf die Verteilung]. Wir wollen das Ergebnis genau aufschreiben, damit das n nicht auf der rechten Seite steht. Hier verwenden wir nun Eigenschaften von Zufallsvariablen, um zu erhaltendn

n(X¯nθ)dN(0,σ2)

Schauen Sie sich die Antwort hier an, um zu sehen, wie die Algebra funktioniert .

Greenparker
quelle
Vielen Dank. Ich verstehe Ihre Ungleichungsalgebra, aber ich habe immer noch einige Verwirrung über Ihren ersten Absatz: "Die asymptotische Verteilung ist nicht von(der Stichprobenmittelwert), sondernX¯n... ". Ich dachte, die CLT sagte, dass sich die Stichprobenverteilung des Stichprobenmittels einer Normalverteilung annähert, alsn, und ich dachte, ˉ X nsei der RV, der alle möglichen Werte annimmt von Stichproben der Größen. Woher kommtn(X¯nθ)nX¯nnkommt von? Warum interessieren wir uns für diese Verteilung und nicht für die Verteilung von ˉ X n? n(X¯nθ)X¯n
Jeremy Radcliff
(Fortsetzung) Geht es darum, die Verteilung der Stichprobenmittel zu normalisieren? Kommt hier die Quadratwurzel her? Hat es mit Scores zu tun ? Z
Jeremy Radcliff
@ jeremyradcliff Ich habe meine Antwort bearbeitet und einen Link eingefügt, der einige Details erklärt. Hoffe das macht jetzt mehr Sinn.
Greenparker
1
Vielen Dank, dass Sie sich die Zeit zum Bearbeiten genommen haben. Der von Ihnen angegebene Link ist genau das, wonach ich gesucht habe. Und Sie haben Recht, das Problem war, dass ich Schwierigkeiten hatte, die Endlichkeit der Stichprobenverteilung und die Tatsache, dass wir gegen nehmen, in Einklang zu bringen . n
Jeremy Radcliff
7

Wenn Sie sich auf einen zentralen Grenzwertsatz beziehen, beachten Sie, dass ein geeigneter Weg zum Ausschreiben darin besteht

(x¯μσ)ndN(0,1)

unter normalen Bedingungen ( der Mittelwert und die Standardabweichung von x i ist)μ,σxi ).

n

nnn

XiBern(p=0.5)

X¯˙N(p,p(1p)n)

n

P(N(p,p(1p)n)<0)>0

(implying the approximation is clearly never perfect), as n,

P(N(p,p(1p)n)<0)0

So that discrepancy between the actual distribution and approximate distribution is disappearing, as is supposed to happen with approximations.

Cliff AB
quelle