Ich habe kürzlich angefangen, Gelman und Hill's "Datenanalyse mit Regression und mehrstufigen / hierarchischen Modellen" zu lesen, und die Frage basiert darauf:
Die Stichprobe enthält 6 Beobachtungen zu Proportionen:
Jedes hat den Mittelwert und die Varianz , wobei die Anzahl der Beobachtungen ist, die zur Berechnung des Anteils verwendet werden . π i π i ( 1 - π i ) nipi
Die Teststatistik ist Stichprobenstandardabweichung dieser Anteile.
Das Buch sagt , dass Erwartungswert der Stichprobenvarianz der sechs Proportionen, , ist . Ich verstehe das alles. ( 1 / 6 ) Σ 6 i = 1 π i ( 1 - π i ) / n i
Was ich wissen möchte, ist die Verteilung von und seine Varianz? Würde mich freuen, wenn jemand mich wissen lassen könnte, was es ist, oder mich zu einem Buch oder Artikel führen könnte, der diese Informationen enthält.
Danke vielmals.
quelle
Antworten:
Die genauen Verteilungen für die Proportionen sind , und die Proportionen können Werte . Die resultierende Verteilung der Probenstandardabweichung ist eine komplizierte diskrete Verteilung. Wenn Sie , kann es in seiner trivialsten Form geschrieben werden als:p i = 0 , 1pich ~ Bin ( nich, πich) / nich Tp≡(p1,p2,...,P6)pich= 0 , 1nich, 2nich, . . . , nich- 1nich, 1 T. p ≡ ( p1, p2, . . . , p6)
Dabei ist ist die Menge aller Proportionsvektoren, die zu einer Stichprobenvarianz führen, die nicht größer als . Es gibt wirklich keine Möglichkeit, dies im allgemeinen Fall zu vereinfachen. Um eine genaue Wahrscheinlichkeit aus dieser Verteilung zu erhalten, müssten Sie die Proportionsvektoren aufzählen, die eine Stichprobenvarianz im interessierenden Bereich ergeben, und dann die Binomialprodukte über diesen aufgezählten Bereich summieren. Es wäre eine mühsame Berechnungsübung für selbst mäßig große Werte von .t n 1 , . . . , n 6P(t)≡{p|T⩽t} t n1,...,n6
Offensichtlich ist die obige Verteilung keine sehr hilfreiche Form. Alles, was es Ihnen wirklich sagt, ist, dass Sie die interessierenden Ergebnisse aufzählen und dann ihre Wahrscheinlichkeiten summieren müssen. Aus diesem Grund wäre es in diesem Fall ungewöhnlich, genaue Wahrscheinlichkeiten zu berechnen, und es ist viel einfacher, eine asymptotische Form für die Verteilung der Stichprobenvarianz heranzuziehen.
quelle