Ich habe mich immer mit der Frage auseinandergesetzt und nie eine gute Antwort erhalten, wie es möglich ist, dass der zentrale Grenzwertsatz - die klassische Version, bei der sich die Verteilung der Stichprobenmittelwerte der Normalität nähert - auf eine Poisson- oder Gamma-Verteilung angewendet werden kann, bei der . Oder für diese Angelegenheit jede andere Verteilung, für die oder vielleicht \ existiert X: X \ neq \ infty, 1-F (X) = 0 .
Als Beispiel eine Gamma - Verteilung gegeben, wie die Anzahl der Proben , , , für einige . Aber wenn , ist . Es wird einfach NIEMALS ein . Dies legt für mich nahe, dass die Verteilung von keine Normalität sein oder sich dieser annähern kann, da notwendigerweise , , was die Anforderungen nicht erfüllt einer normalen Verteilung , wobei .
Ich würde mich im Leben und auf allem, was auf der CLT basiert, viel besser fühlen, wenn mir jemand helfen könnte, zu verstehen, wo meine Logik in die Irre gegangen ist.
quelle
Antworten:
Dies ist eine ausgezeichnete Frage, da sie zeigt, dass Sie über die intuitiven Aspekte der Theoreme nachdenken, die Sie lernen. Damit sind Sie den meisten Schülern, die das CLT lernen, voraus. Hier werde ich versuchen, Ihnen eine Erklärung zu geben, wie es dem CLT möglich ist, Zufallsvariablen mit eingeschränkter Unterstützung zu halten.
Der klassische zentrale Grenzwertsatz gilt für jede Folge die aus unabhängigen und identisch verteilten Zufallsvariablen mit beliebigem Mittelwert und endlich besteht Nicht-Null-Varianz . Angenommen, Sie haben eine solche Sequenz und sie sind durch , und daher deckt ihre Unterstützung nicht die gesamte reale Linie ab.X1,X2,X3,...∼IID Dist(μ,σ2) μ 0<σ2<∞ xmin⩽Xi⩽xmax
Der zentrale Grenzwertsatz bezieht sich auf die Verteilung des Stichprobenmittelwerts und auf die eingeschränkte Unterstützung der zugrunde liegenden Zufallsvariablen in In der Reihenfolge muss diese Statistik auch die Grenzen . Die Darstellung verdickt sich also - der Stichprobenmittelwert, der Gegenstand des Satzes ist, ist ebenfalls begrenzt! Wie kann das CLT halten, wenn dies der Fall ist?X¯n≡1n∑ni=1Xi xmin⩽X¯n⩽xmax
Ihr Problem ergibt sich aus der Tatsache, dass die aus diesem Theorem resultierende Verteilungsnäherung eine Verteilung mit begrenzter Unterstützung durch eine mit unbegrenzter Unterstützung approximiert und daher nicht korrekt sein kann. Sie haben Recht damit - die Verteilungsnäherung für großes ist nur eine Näherung , und sie gibt tatsächlich die Wahrscheinlichkeit falsch an, dass der Stichprobenmittelwert außerhalb seiner Grenzen liegt (indem Sie diese positive Wahrscheinlichkeit angeben).n
Die CLT ist jedoch keine Aussage über eine Verteilungsnäherung für endliches . Es geht um die Grenzverteilung des standardisierten Stichprobenmittelwerts. Die Grenzen dieser Menge sind:n
Als wir nun die Grenzen und was bedeutet, dass die Grenzen des standardisierten Stichprobenmittelwerts breiter werden und breiter und konvergieren in der Grenze zur gesamten realen Linie. (Oder, um es etwas formeller auszudrücken, für jeden Punkt in der realen Linie umfassen die Grenzen diesen Punkt für ein ausreichend großes .) Eine Folge davon ist, dass die Wahrscheinlichkeit den Teilen außerhalb der Grenzen durch die Normalen zugeschrieben wird Die Verteilung konvergiert gegen Null als .n→∞ zmin→−∞ zmax→∞ n n→∞
Hier kommen wir zum Kern des Problems bezüglich Ihrer Bedenken bezüglich des CLT. Es ist wahr, dass für jedes endliche eine normale Annäherung an die Verteilung des Stichprobenmittelwerts Teilmengen von Werten, die außerhalb der Grenzen der wahren Unterstützung liegen, eine positive Wahrscheinlichkeit verleiht. Wenn wir jedoch die Grenze konvergiert diese fehlerhafte positive Wahrscheinlichkeit gegen Null. Die Verteilungsnäherung an den standardisierten Stichprobenmittelwert konvergiert gegen die wahre Verteilung dieser Größe im Grenzbereich, obwohl die Näherung nicht genau für endliches .n n→∞ n
quelle
Ihre Quelle der Verwirrung stammt aus zwei Quellen:
1) Die CLT gilt für die normalisierten Stichprobenmittel, dh:
die um 0 zentriert ist, lässt daher negative Werte mit positiver Wahrscheinlichkeit zu. Als extremes Beispiel kann, wenn ist, für Poisson negativ sein . Tatsächlich können Sie leicht schließen, dass wenn niemals negativ ist, konstant sein muss (daher ).n=1 X1−μσ X1 Zn Xi σ=0
2) Die CLT für endliches ist nur ein lokales Ergebnis um den Mittelwert. Mit anderen Worten, die Tatsache, dass ungefähr (die normale CDF) ist, ist für nahe 0 eher wahr . Wenn relativ zu nicht groß genug ist , ist dies Annäherung bricht zusammen.n P(Zn≤x) ϕ(x) x n x
Wenn Sie sagen, dass Sie die Körpergröße messen, kann eine normale Standardnäherung bedeuten, dass eine negative Körpergröße eine positive Wahrscheinlichkeit hat. Dies ist falsch, da die meisten Erwachsenen Höhen zwischen 4 und 7 Fuß haben, sodass die Annäherung über diese Grenzen hinaus zusammenbrechen würde, wenn Ihr klein ist.n
Wenn alternativ und , werden viele Realisierungen von sein, um auf Situationen zu schließen, in denen negativ ist, so dass meistens positiv ist, und Sie könnten ( fälschlicherweise) schlussfolgern, dass es niemals negativ sein kann.P(Xi=1)=0.99999 P(Xi=−1)=0.00001 Xi Xi Zn
quelle