Stichprobenverteilung des Mittelwerts einer Beta

8

Angenommen, wir haben . Was bedeutet die Stichprobenverteilung der Stichprobe?X.Beta(α,β)

Mit anderen Worten, welcher Verteilung folgt die Stichprobe einer Beta?X.¯

Josh
quelle
1
Wow - schwierige Frage. Es könnte schwierig sein, alle Werte von Alpha und Beta zu charakterisieren, da bei einigen Parametern seltsame Formen auftreten. Wenn beide jedoch größer als 1 sind, sieht es so aus, als würde es asymptotisch zu Gauß pro CLT tendieren, aber ich kann nicht sag sicher.
T3am5hark
4
Die asymptotische Verteilung eines Stichprobenmittelwerts einer Zufallsstichprobe wird von der CLT bestimmt, wenn die Varianz vorliegt, was dies nicht erfordert α,β>1.
Christoph Hanck

Antworten:

2

Hinweis: Siehe auch für dieselbe Frage /math/85535/sum-of-niid-beta-distributed-variables

Für den Fall einer gleichmäßigen Verteilung Beta(1,1)Die Verteilung der Summe mehrerer unabhängiger Variablen (und der Mittelwert hängt damit zusammen) wurde als Irwin-Hall- Verteilung beschrieben.

Wenn

X.n=ich=1nY.ich mit U.ichBeta(1,1)

dann hast du einen Spline of Degree n- -1

fX.(x;;n)=1(n- -1)!j=0n- -1einj(k,n)xj zum kxk+1

bei dem die einj(k,n) kann durch eine Wiederholungsbeziehung beschrieben werden:

aj(k,n)={1k=0,j=n- -10k=0,j<n- -1einj(k- -1,n)+(- -1)n+k- -j- -1(nk)(n- -1j)kn- -j- -1k>1


Sie könnten die obige Formel als durch eine wiederholte Faltung von konstruiert sehen Xn1 mit Ynwo das Integral stückweise gelöst wird. Können wir dies möglicherweise für verteilte Beta-Variablen mit irgendwelchen verallgemeinern?α und β?

Lassen

Xn(α,β)=i=1nYi with UiBeta(α,β)

Wir erwarten die Funktion fX.(x;;n,α,β) aufgeteilt werden in nStücke (obwohl möglicherweise kein Spline mehr). Die Faltung zur Berechnung der Verteilung vonX.n(α,β)=X.n- -1(α,β)+U.n wird so etwas sein wie:

fX.(x;;n,α,β)=1- -Mindest(1,n- -x)Mindest(1,x)fX.(x- -y;;n- -1,α,β)yα- -1(1- -y)β- -1dy

  • Zum n=2::

    fX.(x;;n,α,β)={0- -xx((x- -y)y)α- -1((1- -x+y)(1- -y))β- -1dywenn 0x1x- -11((x- -y)y)α- -1((1- -x+y)(1- -y))β- -1dywenn 1x2

    • Für Ganzzahl α und β: die Begriffe wie((x- -y)y)α- -1 und ((1- -x+y)(1- -y))β- -1 kann für ganzzahlige Werte von erweitert werden α und β, so dass das Integral einfach zu lösen ist.

      Zum Beispiel:

      fX(x;2,2,2)={130x3(x25x+5)if x1130(2x)3(x2+x1)if x1fX(x;2,3,3)={1630x5(x49x3+30x242x+21)if x11630(2x)5(x4+x32x+1)if x1

Die Lösung für ganzzahlige Werte von α und βwird auch ein Spline sein. Möglicherweise könnte dies in eine nette (oder wahrscheinlich nicht so schöne) Formel für allgemeinere Situationen (nicht nur) umgewandelt werdenn=2 und α=β=2 or α=β=3). Aber an diesem Punkt braucht man einige Tassen Kaffee oder besser eine Infusion, um dieses Zeug anzugehen.

Sextus Empiricus
quelle
1

Ich dachte, dies sei eine interessante Frage, daher hier eine kurze visuelle Untersuchung. ZumX.B.etein(α1,α2)Ich habe zuerst 4 separate Beta-Distributionen ausgewählt (PDFs siehe unten).

Beta_PDFs

Dann habe ich Probenmittel gesammelt, X.¯=1nich=1nxichund zeichnete die entsprechenden Histogramme wie unten gezeigt. Die Ergebnisse sehen normal aus und ich neige dazu, @ ChristophHancks Behauptung zu glauben, dass hier der zentrale Grenzwertsatz (CLT) am Werk ist.

Beta_ bedeutet


MATLAB-Code

% Parameters
n = 5000;
K = 5000;
% Define Beta distributions
pd1 = makedist('Beta',0.25,0.45);
pd2 = makedist('Beta',0.25,2.5);
pd3 = makedist('Beta',4,0.15);
pd4 = makedist('Beta',3.5,5);
% Collect Sample Means
X1bar = zeros(K,1);
X2bar = zeros(K,1);
X3bar = zeros(K,1);
X4bar = zeros(K,1);
for k = 1:K                           % get K sample means 
    X1bar(k) = mean(random(pd1,n,1)); % take mean of n samples
    X2bar(k) = mean(random(pd2,n,1));
    X3bar(k) = mean(random(pd3,n,1));
    X4bar(k) = mean(random(pd4,n,1));
end
% Plot Beta distribution PDFs
Xsupport = 0:.01:1;

figure, hold on, box on
title('Beta(\alpha_1,\alpha_2) PDFs')
plot(Xsupport,pdf(pd1,Xsupport),'r-','LineWidth',2.2)
plot(Xsupport,pdf(pd2,Xsupport),'b-','LineWidth',2.2)
plot(Xsupport,pdf(pd3,Xsupport),'k-','LineWidth',2.2)
plot(Xsupport,pdf(pd4,Xsupport),'g-','LineWidth',2.2)
legend('(0.25,0.45)','(0.25,2.5)','(4,0.15)','(3.5,5)')

figure
s(1) = subplot(2,2,1), hold on, box on
    histogram(X1bar,'FaceColor','r')
s(2) = subplot(2,2,2), hold on, box on
    histogram(X2bar,'FaceColor','b')
s(3) = subplot(2,2,3), hold on, box on
    histogram(X3bar,'FaceColor','k')
s(4) = subplot(2,2,4), hold on, box on
    histogram(X4bar,'FaceColor','g')
title(s(1),'(0.25,0.45)')
title(s(2),'(0.25,2.5)')
title(s(3),'(4,0.15)')
title(s(4),'(3.5,5)')

Bearbeiten: Dieser Beitrag war ein schneller Versuch, dem OP etwas zu bieten. Wie bereits erwähnt, impliziert der zentrale Grenzwertsatz (CLT) , dass diese Ergebnisse für jede Verteilung mit endlicher Varianz gelten.

SecretAgentMan
quelle
2
Sie haben eine Reihe von Beispielen ausgeführt, die die CLT demonstrieren. Wie in den Kommentaren erwähnt, haben Beta-Verteilungen in diesen Beispielen nichts Besonderes: Sie können buchstäblich mit jeder Verteilung mit endlicher Varianz beginnen und identische Ergebnisse erhalten.
whuber
Du hast Recht. Ich habe diesen Kommentar positiv bewertet, aber eine Antwort gegeben, weil es keine gab. Natürlich gilt CLT für eine endliche Varianzverteilung. Ich habe sogar den Kommentator in der Antwort erwähnt. Soll ich diese Antwort löschen? Oder Community machen?
SecretAgentMan