ich benutze eine Verteilung mit Mittelwert bedeuten und Varianz , hinzugefügt, um die Normalverteilung zu bedeuten.
Gesetzt den Fall mit . Die formale Aussage des zentralen Grenzwertsatzes (CLT) besagt dies
Es wird hier diskutiert , dass die Aussage
ist keine Aussage über die Konvergenz in der Verteilung, sondern eine Annäherung. Diese Annäherung wird häufig als eine ziemlich anständige Annäherung zitiert, wenn.
Theoretisch könnten wir jetzt noch einen Schritt weiter gehen und das sagen
ist eine ungefähre Aussage des CLT.
Angesichts dessen ist nicht die eigentliche CLT, ich frage mich, wie gut diese Annäherung funktioniert. Funktioniert es im Allgemeinen gut? Ehrlich gesagt wäre ich darüber im Falle einer besonders verzerrten Verteilung besorgt.
Wenn dies zu weit gefasst ist, kann ich dies schließen.
central-limit-theorem
approximation
Klarinettist
quelle
quelle
Antworten:
Wenn der Z-Score wirklich eine Standardnormalverteilung wäre, wären Ihre nachfolgenden Annäherungen genau. Der Fehlergrad sollte grob mit einem gewissen Maß an Abstand zwischen der Z-Score-Verteilung und dem Standard-Gaußschen skalieren.
Wir können die KS-Entfernung als unsere Metrik im Raum von CDFs verwenden. Nehmen wir an, wir werden sammelnN Proben und unsere (unbekannte) wahre Probe CDF des Z-Scores von diesen N Proben haben einen KS-Abstand von ϵN :: maxz|FZn(z)−FΦ(z)|=ϵN .
wir nun von zu wobei nur eine Verschiebung von Maßstab und Ort beinhaltet (dh eine lineare Transformation des Arguments von ). Gleiches gilt, um zu einer Summe normaler Zufallsvariablen mit dem gleichen Mittelwert und der gleichen Varianz wie Ihre tatsächliche Population zu erhalten. Tatsächlich werden Sie beide Variablen exakt gleich transformieren, also werden wir einfach und ähnlich für - Da wir das Argument jeder Distribution derselben Transformation unterziehen, werden vertikale Abstände beibehalten.FZn(z) FSn(s) Sn=∑N1Xi Lz FZn(z) FΦ(z) FZn(z)↦FZn(L−1z) FΦ
Der KS-Abstand für konvergiert also mit der gleichen Rate wie für gegen Null . Jedoch keine Grenzverteilung hat (es ist im Grunde , was nicht eine Verteilung ist) , während konvergiert zu einer tatsächlichen Verteilungsfunktion.FSn FZn FSn F(x)=0.5 FZn
quelle