Eine sehr einfache Version des zentralen begrenzten Theorems wie
ist Lindeberg-Lévy CLT. Ich verstehe nicht, warum es ein auf der linken Seite. Und Lyapunov CLT sagt
aber warum nicht ? Würde mir jemand sagen, was diese Faktoren sind, wie und ? Wie bekommen wir sie in den Satz?
central-limit-theorem
intuition
Fliegende Schweine
quelle
quelle
Antworten:
Schöne Frage (+1) !!
Sie werden , dass für unabhängige Zufallsvariablen erinnern und Y , V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) und V a r ( a ⋅ X ) = a 2 ⋅ V a r ( X ) . Die Varianz von ∑ n i = 1 X i ist alsoX Y Var(X+Y)=Var(X)+Var(Y) Var(a⋅X)=a2⋅Var(X) ∑ni=1Xi , und die Varianz von ˉ X = 1∑ni=1σ2=nσ2 istnσ2/n2=σ2/n.X¯=1n∑ni=1Xi nσ2/n2=σ2/n
Dies ist für die Varianz . Um eine Zufallsvariable zu standardisieren, dividieren Sie sie durch ihre Standardabweichung. Wie Sie wissen, ist der erwartete Wert von ist μ , so dass die VariableX¯ μ
hat den erwarteten Wert 0 und die Varianz 1. Wenn es also zu einem Gaußschen tendiert, muss es das Standard-GaußscheN sein(0,
In Bezug auf Ihren zweiten Punkt glaube ich, dass die oben gezeigte Gleichung zeigt, dass Sie durch und nicht durch √ dividieren müssenσ , um die Gleichung zu standardisieren und zu erklären, warum Siesn(den Schätzer vonσ)und nicht √ verwendenσ−−√ sn σ) .sn−−√
Ergänzung: @whuber schlägt vor, das Warum der Skalierung durch √ zu diskutieren . Er tut esdort, aber weil die Antwort sehr lang ist, werde ich versuchen, das Wesentliche seiner Argumentation festzuhalten (die eine Rekonstruktion von de Moivres Gedanken ist).n−−√
Wenn Sie eine große Anzahl von +1 und -1 addieren , können Sie die Wahrscheinlichkeit, dass die Summe j ist, durch Elementarzählen approximieren . Das Log dieser Wahrscheinlichkeit ist proportional zu - j 2 / n . Wenn wir also wollen, dass die obige Wahrscheinlichkeit gegen eine Konstante konvergiert, wenn n groß wird, müssen wir einen Normalisierungsfaktor in O ( √) verwendenn j −j2/n n .O(n−−√)
Mit modernen mathematischen Werkzeugen (post de Moivre) können Sie die oben erwähnte Annäherung erkennen, indem Sie feststellen, dass die gesuchte Wahrscheinlichkeit ist
was wir durch Stirlings Formel approximieren
quelle
Es gibt eine schöne Theorie, welche Art von Verteilungen Verteilungen von Summen von Zufallsvariablen einschränken können. Die nette Quelle ist das folgende Buch von Petrov, das mir persönlich sehr gut gefallen hat.
Es stellt sich heraus, dass, wenn Sie Grenzen dieses Typs untersuchen, wobei unabhängige Zufallsvariablen sind, die Verteilungen der Grenzen sind nur bestimmte Distributionen.
Es gibt dann eine Menge Mathematik, die sich zu mehreren Theoremen zusammensetzt, die vollständig charakterisieren, was im Grenzfall passiert. Eines dieser Theoreme geht auf Feller zurück:
Theorem Sei eine Folge von unabhängigen Zufallsvariablen, die Verteilungsfunktion von und eine Folge von positiven Konstanten. Damit{Xn;n=1,2,...} Vn(x) Xn an
und
es ist notwendig und ausreichend, dass
und
Dieser Satz gibt Ihnen dann eine Vorstellung davon, wie aussehen sollte.an
Die allgemeine Theorie in diesem Buch ist so konstruiert, dass die Normierungskonstante in keiner Weise eingeschränkt ist, aber Endsätze, die notwendige und ausreichende Bedingungen angeben, lassen keinen anderen Raum für Normierungskonstanten als .n−−√
quelle
s repräsentiert die Standardabweichung der Stichprobe für den Stichprobenmittelwert. s ist die Stichprobenvarianz für den Stichprobenmittelwert und ist gleich S / n. Wobei S die Stichprobenschätzung der Populationsvarianz ist. Da s = S / √n ist, erklärt dies, wie √n in der ersten Formel erscheint. Beachten Sie, dass es im Nenner ein σ geben würde, wenn der Grenzwert wären n 2 n 2 n 2 n n
N (0,1), aber die Grenze wird als N (0, σ ) angegeben. Da S ist eine konsequente Abschätzung von σ in der secnd Gleichung aus der Begrenzung genommen σ verwendet wird.2 n
quelle
Intuitiv sollten wir erwarten, dass ungefähr gleich ist , wenn für ein ist ; es scheint eine ziemlich vernünftige Erwartung zu sein, obwohl ich es im Allgemeinen nicht für notwendig halte. Der Grund für die in dem ersten Ausdruck ist , dass die Varianz von bis geht wie und so die ist die Varianz so aufzublasen , daß der Ausdruck gleich nur Varianz . Im zweiten Ausdruck ist der Term definiert alsZn→N(0,σ2) σ2 Var(Zn) σ2 n−−√ X¯n−μ 0 1n n−−√ σ2 sn ∑ni=1Var(Xi)−−−−−−−−−−−√ während die Varianz des Zählers wie wächst , so haben wir wieder , daß die Varianz des gesamten Ausdruck eine Konstante ist (ist in diesem Fall).∑ni=1Var(Xi) 1
Grundsätzlich wissen wir, dass mit der Verteilung von etwas "Interessantes" passiert , aber wenn wir es nicht richtig zentrieren und skalieren, können wir es nicht sehen. Ich habe gehört, dass dies manchmal als Notwendigkeit beschrieben wird, das Mikroskop einzustellen. Wenn wir nicht durch sprengen (zB), dann haben wir nur in der Verteilung durch das schwache Gesetz ; Ein interessantes Ergebnis für sich, aber nicht so informativ wie das CLT. Wenn wir mit einem Faktor aufpumpen, der von dominiert wird , erhalten wir immer noch während jeder Faktor der dominiert ˉ X -μ√X¯n:=1n∑iXi X¯−μ ˉ X n-μ→0an √n−−√ X¯n−μ→0 an an( ˉ X n-μ)→0an √n−−√ an(X¯n−μ)→0 an an( ˉ X n-μ)→∞ √n−−√ gibt . Es stellt sich heraus, dass genau die richtige Vergrößerung ist, um zu sehen, was in diesem Fall vor sich geht nach dem Gesetz des iterierten Logarithmus).an(X¯n−μ)→∞ n−−√
quelle