Probenverteilung aus zwei unabhängigen Bernoulli-Populationen

17

Nehmen wir an, wir haben Stichproben von zwei unabhängigen Bernoulli-Zufallsvariablen, und .B e r ( θ 2 )Ber(θ1)Ber(θ2)

Wie beweisen wir, dass ?

(X¯1-X¯2)-(θ1-θ2)θ1(1-θ1)n1+θ2(1-θ2)n2dN(0,1)

Angenommen, .n1n2

Ein alter Mann im Meer.
quelle
Z_i = X_1i - X_2i ist eine Folge von iid rv von endlichem Mittelwert und Varianz. Damit erfüllt es den zentralen Grenzwertsatz von Levy-Linderberg, aus dem Ihre Ergebnisse folgen. Oder fordern Sie einen Nachweis über das CLT selbst an?
Drei Tage,
@ThreeDiag Wie wenden Sie die LL-Version des CLT an? Ich denke nicht, dass das richtig ist. Schreiben Sie mir eine Antwort, um die Details zu überprüfen.
Ein alter Mann im Meer.
Alle Details sind schon da. Für die Anwendung von LL benötigen Sie eine Folge von iid rv mit endlichem Mittelwert und Varianz. Die Variablen Z_i = X_i1 und X_i2 erfüllen alle drei Anforderungen. Die Unabhängigkeit ergibt sich aus der Unabhängigkeit der beiden ursprünglichen Bernoulli-Vars, und Sie können sehen, dass E (Z_i) und V (Z_i) endlich sind, indem Sie die Standardeigenschaften von E und V anwenden
Three Diag
1
"Stichproben zweier unabhängiger Bernoulli-Zufallsvariablen" - falscher Ausdruck. Muss sein: "zwei unabhängige Samples aus Bernoulli-Distributionen".
Viktor
1
Bitte fügen Sie "als " hinzu. n1,n2
Viktor

Antworten:

10

Setzen Sie ,b=a=θ1(1θ1)n1 , A=(ˉX1-θ1)/a, B=(ˉX2-θ2)/b. Wir haben AdN(0,1),BdN(0,1). In Bezug auf charakteristische Funktionen bedeutet dies ϕA(t)Eeb=θ2(1-θ2)n2EIN=(X¯1-θ1)/einB=(X¯2-θ2)/bEINdN(0,1), BdN(0,1) Wir wollen beweisen, dass D:= a

ϕEIN(t)EeichtEINe-t2/2, ϕB(t)e-t2/2.
D: =einein2+b2EIN-bein2+b2BdN(0,1)

Da und B unabhängig sind, ist ϕ D ( t ) = ϕ A ( aEINB wie wir es sein wollen.

ϕD(t)=ϕEIN(einein2+b2t)ϕB(-bein2+b2t)e-t2/2,

Dieser Beweis ist unvollständig. Hier brauchen wir einige Schätzungen für die gleichmäßige Konvergenz der charakteristischen Funktionen. Im vorliegenden Fall können wir jedoch explizite Berechnungen durchführen. Setze . ϕ X 1 , 1 ( t )p=θ1, m=n1 alst3m-3/20. Somit kann für eine festet, φD(t)=(1-eine2t2

ϕX1,1(t)=1+p(eicht-1),ϕX¯1(t)=(1+p(eicht/m-1))m,ϕX¯1-θ1(t)=(1+p(eicht/m-1))me-ichpt,ϕEIN(t)=(1+p(eicht/mp(1-p)-1))me-ichptm/p(1-p)=((1+p(eicht/mp(1-p)-1))e-ichpt/mp(1-p))m=(1-t22m+Ö(t3m-3/2))m
t3m-3/20t (auch wennein0oderb0), da| e-y-(1-y/m)m| y2/2m
ϕD(t)=(1-ein2t22(ein2+b2)n1+Ö(n1-3/2))n1(1-b2t22(ein2+b2)n2+Ö(n2-3/2))n2e-t2/2
ein0b0|e-y-(1-y/m)m|y2/2m wenn y / m < 1 / 2 (siehe /math/2566469/uniform-bounds-for-1-y-nn-exp-y/ ). y/m<1/2

Es ist zu beachten, dass ähnliche Berechnungen für beliebige (nicht notwendigerweise Bernoulli) Verteilungen mit endlichen zweiten Momenten unter Verwendung der Erweiterung der charakteristischen Funktion in Bezug auf die ersten beiden Momente durchgeführt werden können.

Viktor
quelle
Das scheint richtig zu sein. Ich melde mich später wieder, wenn ich Zeit habe, alles zu überprüfen. ;)
Ein alter Mann im Meer.
-1

Der Beweis Ihrer Aussage ist gleichbedeutend mit dem Beweis des (Levy-Lindenberg-) zentralen Grenzwertsatzes, der besagt

{Zich}ich=1nE(Zich)=μV(Zich)=σ2

n(Z¯-μ)dN(0,σ2)

Z¯=ichZich/n

Dann ist es leicht zu sehen, wenn wir setzen

Zich=X1ich-X2ich
X1ich,X2ichBer(θ1)Ber(θ2)

E(Zich)=θ1-θ2=μ

und

V(Zich)=θ1(1-θ1)+θ2(1-θ2)=σ2

n1n2

Drei Diag
quelle
n1n2
Ich werde es später zeigen, wenn Sie es nicht bekommen können. Hinweis: Berechnen Sie die Varianz des Stichprobenmittelwerts von Z und verwenden Sie diese als Variable im Theorem
Drei Tage,
n1n2
Werde so schnell wie möglich ein wenig timr finden. Es gab tatsächlich eine Feinheit, die die Verwendung von LL clt ohne Anpassung verhinderte. Es gibt drei Möglichkeiten, von denen die einfachste darin besteht, dass für große n1 und n2 X1 und X2 in der Verteilung auf Normalen gehen, dann ist auch eine lineare Kombination von Normal normal. Dies ist eine Eigenschaft von Normalen, die Sie als gegeben annehmen können, andernfalls können Sie dies durch charakteristische Funktionen beweisen.
Drei Tage,
Die anderen beiden benötigen entweder einen anderen CLT (Lyapunov möglicherweise) oder behandeln alternativ n1 = i und n2 = i + k. Dann für große i können Sie im Wesentlichen k ignorieren und Sie können zurückgehen, um LL anzuwenden (aber es wird noch etwas Sorgfalt erfordern, um die richtige Varianz zu nageln)
Drei Diag