Wie kann der zentrale Grenzwertsatz für Verteilungen gelten, bei denen die Zufallsvariable begrenzt ist?

10

Ich habe mich immer mit der Frage auseinandergesetzt und nie eine gute Antwort erhalten, wie es möglich ist, dass der zentrale Grenzwertsatz - die klassische Version, bei der sich die Verteilung der Stichprobenmittelwerte der Normalität nähert - auf eine Poisson- oder Gamma-Verteilung angewendet werden kann, bei der . Oder für diese Angelegenheit jede andere Verteilung, für die oder vielleicht \ existiert X: X \ neq \ infty, 1-F (X) = 0 .P(x<0)=0X:X,F(X)=0X:X,1F(X)=0

Als Beispiel eine Gamma - Verteilung gegeben, wie die Anzahl der Proben n , P(X¯=α)1 , α0 , für einige X¯i . Aber wenn α<0 , ist P(X¯=α)=0 . Es wird einfach NIEMALS ein X¯i<0 . Dies legt für mich nahe, dass die Verteilung von X¯ keine Normalität sein oder sich dieser annähern kann, da f(X¯) notwendigerweise 0 , X¯<0 , was die Anforderungen nicht erfüllt einer normalen Verteilung , wobei f(y)>0,yR .

Ich würde mich im Leben und auf allem, was auf der CLT basiert, viel besser fühlen, wenn mir jemand helfen könnte, zu verstehen, wo meine Logik in die Irre gegangen ist.

HairyPotatoCat
quelle
6
Die ursprüngliche Formulierung des CLT wurde auf die Bernoulli- Variable angewendet : das Beispiel mit den strengsten möglichen Grenzen! Warum also nicht diesen speziellen Fall bei Ihrer Suche nach dem Fehler in der Logik berücksichtigen? Wenn die Antwort nicht sofort ersichtlich wird (Hinweis: Überlegen Sie, was die Standardisierung des Mittelwerts bewirkt), schlägt mein Konto unter stats.stackexchange.com/questions/3734/… möglicherweise einige Ideen vor.
whuber
4
Es könnte hilfreich sein, einen Blick darauf zu werfen, was eine Basisversion des zentralen Grenzwertsatzes tatsächlich sagt, und von dort aus zu überlegen, wie die Grenzen des standardisierten Mittelwerts aussehen.
Glen_b -Rate State Monica

Antworten:

14

Dies ist eine ausgezeichnete Frage, da sie zeigt, dass Sie über die intuitiven Aspekte der Theoreme nachdenken, die Sie lernen. Damit sind Sie den meisten Schülern, die das CLT lernen, voraus. Hier werde ich versuchen, Ihnen eine Erklärung zu geben, wie es dem CLT möglich ist, Zufallsvariablen mit eingeschränkter Unterstützung zu halten.

Der klassische zentrale Grenzwertsatz gilt für jede Folge die aus unabhängigen und identisch verteilten Zufallsvariablen mit beliebigem Mittelwert und endlich besteht Nicht-Null-Varianz . Angenommen, Sie haben eine solche Sequenz und sie sind durch , und daher deckt ihre Unterstützung nicht die gesamte reale Linie ab.X1,X2,X3,...IID Dist(μ,σ2)μ0<σ2<xminXixmax

Der zentrale Grenzwertsatz bezieht sich auf die Verteilung des Stichprobenmittelwerts und auf die eingeschränkte Unterstützung der zugrunde liegenden Zufallsvariablen in In der Reihenfolge muss diese Statistik auch die Grenzen . Die Darstellung verdickt sich also - der Stichprobenmittelwert, der Gegenstand des Satzes ist, ist ebenfalls begrenzt! Wie kann das CLT halten, wenn dies der Fall ist?X¯n1ni=1nXixminX¯nxmax

Zentraler Grenzwertsatz (CLT): Wenn die Standardnormalverteilungsfunktion ist, haben wir:Φ

limnP(X¯nμσ/nz)=Φ(z).

Annäherung aus CLT: Für großes wir die ungefähre Verteilung:n

X¯nN(μ,σ2n).

Ihr Problem ergibt sich aus der Tatsache, dass die aus diesem Theorem resultierende Verteilungsnäherung eine Verteilung mit begrenzter Unterstützung durch eine mit unbegrenzter Unterstützung approximiert und daher nicht korrekt sein kann. Sie haben Recht damit - die Verteilungsnäherung für großes ist nur eine Näherung , und sie gibt tatsächlich die Wahrscheinlichkeit falsch an, dass der Stichprobenmittelwert außerhalb seiner Grenzen liegt (indem Sie diese positive Wahrscheinlichkeit angeben).n

Die CLT ist jedoch keine Aussage über eine Verteilungsnäherung für endliches . Es geht um die Grenzverteilung des standardisierten Stichprobenmittelwerts. Die Grenzen dieser Menge sind:n

zmin=xminμσ/nX¯nμσ/nxmaxμσ/n=zmax.

Als wir nun die Grenzen und was bedeutet, dass die Grenzen des standardisierten Stichprobenmittelwerts breiter werden und breiter und konvergieren in der Grenze zur gesamten realen Linie. (Oder, um es etwas formeller auszudrücken, für jeden Punkt in der realen Linie umfassen die Grenzen diesen Punkt für ein ausreichend großes .) Eine Folge davon ist, dass die Wahrscheinlichkeit den Teilen außerhalb der Grenzen durch die Normalen zugeschrieben wird Die Verteilung konvergiert gegen Null als .nzminzmaxnn

Hier kommen wir zum Kern des Problems bezüglich Ihrer Bedenken bezüglich des CLT. Es ist wahr, dass für jedes endliche eine normale Annäherung an die Verteilung des Stichprobenmittelwerts Teilmengen von Werten, die außerhalb der Grenzen der wahren Unterstützung liegen, eine positive Wahrscheinlichkeit verleiht. Wenn wir jedoch die Grenze konvergiert diese fehlerhafte positive Wahrscheinlichkeit gegen Null. Die Verteilungsnäherung an den standardisierten Stichprobenmittelwert konvergiert gegen die wahre Verteilung dieser Größe im Grenzbereich, obwohl die Näherung nicht genau für endliches .nnn

Ben - Monica wieder einsetzen
quelle
3

Ihre Quelle der Verwirrung stammt aus zwei Quellen:

1) Die CLT gilt für die normalisierten Stichprobenmittel, dh:

Zn=Sn/nμσ/n=Snnμσn ,

die um 0 zentriert ist, lässt daher negative Werte mit positiver Wahrscheinlichkeit zu. Als extremes Beispiel kann, wenn ist, für Poisson negativ sein . Tatsächlich können Sie leicht schließen, dass wenn niemals negativ ist, konstant sein muss (daher ).n=1X1μσX1ZnXiσ=0

2) Die CLT für endliches ist nur ein lokales Ergebnis um den Mittelwert. Mit anderen Worten, die Tatsache, dass ungefähr (die normale CDF) ist, ist für nahe 0 eher wahr . Wenn relativ zu nicht groß genug ist , ist dies Annäherung bricht zusammen.nP(Znx)ϕ(x)xnx

Wenn Sie sagen, dass Sie die Körpergröße messen, kann eine normale Standardnäherung bedeuten, dass eine negative Körpergröße eine positive Wahrscheinlichkeit hat. Dies ist falsch, da die meisten Erwachsenen Höhen zwischen 4 und 7 Fuß haben, sodass die Annäherung über diese Grenzen hinaus zusammenbrechen würde, wenn Ihr klein ist.n

Wenn alternativ und , werden viele Realisierungen von sein, um auf Situationen zu schließen, in denen negativ ist, so dass meistens positiv ist, und Sie könnten ( fälschlicherweise) schlussfolgern, dass es niemals negativ sein kann.P(Xi=1)=0.99999P(Xi=1)=0.00001XiXiZn

Alex R.
quelle