Ermitteln der Verteilung des Stichprobenbereichs für eine Beta-Population

7

Lassen X1,X2,,Xn Zufällige Variablen mit Dichte sein

f(x)=2(1x)10<x<1

Ich versuche, die Verteilung des Stichprobenbereichs abzuleiten .R=X(n)X(1)

Die übliche Art, wie ich diese Probleme mache, besteht darin, zuerst die Verbindungsdichte von unter Verwendung von und dann die Verteilung von als Grenzdichte zu ermitteln. Dies ist im Allgemeinen recht einfach, da wir die gemeinsame Verteilung von . Für dieses spezielle Problem ist es jedoch ziemlich umständlich, die Integration zum Auffinden des Rand-PDFs von Hand zu bewerten.(R,S)S=X(1)R(X.(1),X.(n))

Für absolut kontinuierliche Verteilungen kann durch eine Änderung der Variablen leicht gezeigt werden, dass die Gelenkdichte von durch gegeben ist(R.,S.)

fR.,S.(r,s)=n(n- -1)(F.(r+s)- -F.(s))n- -2f(s)f(r+s)1s<r+s

, wobei die Bevölkerungsverteilungsfunktion ist.F.

Also hier habe ich nach Vereinfachung

fR,S(r,s)=4n(n1)(r(22sr))n2(1s)(1r- -s)10<s<r+s<1

Das heißt, das PDF von für sollte seinR.0<r<1

fR.(r)=01- -rfR.,S.(r,s)ds=4n(n- -1)rn- -201- -r(2- -2s- -r)n- -2(1- -s)(1- -r- -s)ds

Jetzt integriere ich nach Teilen

ich=01- -r(2- -2s- -r)n- -2(1- -s)(1- -r- -s)ds

unter Hinweis darauf, dass

d[(1s)(1rs)]=(2s+r2)ds

Ich überspringe einige Details

ich=[(1- -s)(1- -r- -s)(2- -2s- -r)n- -12(1- -n)]]01- -r+01- -r(2- -2s- -r)n2(1- -n)ds=(r- -1)(2- -r)n- -12(1- -n)- -14(1- -n)2- -rrtndt=(r- -1)(2- -r)n- -12(1- -n)+14(n2- -1)[rn+1- -(2- -r)n+1]]

Es mag nicht so scheinen, aber dies von Hand zu tun und jeden Schritt aufzuschreiben, dauerte ziemlich lange.

Schließlich bekomme ich das PDF von alsR.

fR.(r)=4n(n- -1)rn- -2[(r- -1)(2- -r)n- -12(1- -n)+14(n2- -1){rn+1- -(2- -r)n+1}}]]10<r<1

Ehrlich gesagt, nach der mühsamen Berechnung weiß ich nicht, ob ich überprüfen möchte, ob dies zu integriert ist oder nicht (ohne Software zu verwenden). Ich weiß also nicht, ob diese Antwort überhaupt Sinn macht.1

Ich würde gerne ein alternatives Verfahren kennen, um das Problem zu lösen, und vielleicht einen effizienteren Weg. Ich denke, die CDF-Methode führt zu fast der gleichen Komplexität.

HartnäckigAtom
quelle
2
Ich kann das gleiche Ergebnis mit mathStatica bestätigen (bin also zuversichtlich, dass Ihre Arbeit korrekt ist).
Wolfies
3
Die einzige Vereinfachung, die ich vorschlagen kann - und die wirklich winzig ist - besteht darin, zu erkennen, dass die Operation den Bereich beibehält, während die Dichte in konvertiert wird Dies erleichtert die Integration etwas. Asymptotische Ausdrücke sind jedoch leicht verfügbar. X.1- -X.2xich(0<x<1).
whuber

Antworten:

-4

Bearbeiten: Bitte hören Sie auf, diesen Kommentar abzustimmen. Es war ein Kommentar und hätte vom OP nicht als Antwort akzeptiert werden dürfen. Bitte lesen Sie die Kommentare und die Literatur, wenn Sie mit dieser Technik nicht vertraut sind. Es scheint, dass die Beziehung zwischen der gleichmäßigen Verteilung und der Beta-Verteilung der geordneten Statistiken nicht gelehrt / verstanden wird.

Ich vermute, Sie haben festgestellt, dass der Bereich als Form der Beta-Dichte verteilt ist? Konvertieren Sie in Uniform, wenn Sie nicht gerne mit Beta arbeiten. Mein Rat ist, es nicht zu integrieren, sondern nur darüber nachzudenken, welcher Form dies ähnelt. Es kann sein, dass es keine geschlossene Form hat, wenn es die unvollständige Beta-Funktion beinhaltet, aber nicht wirklich notwendig ist, um die Distribution zu finden.

Rosalie
quelle
3
Ich glaube, Ihr Rat ist falsch - vielleicht basiert er auf einer falschen Interpretation der Frage. Wenn Sie nach dem erneuten Lesen der Frage der Meinung sind, dass Ihr Ansatz richtig ist, beweisen Sie mir bitte das Gegenteil, indem Sie uns eine explizite Antwort geben.
whuber
Warum haben Sie die Kommentare mit den Links zur Antwort auf diese Frage gelöscht? Hör auf, meine Antwort abzustimmen. Und OP hätte diesen Kommentar nicht als Antwort akzeptieren sollen. Dies ist buchstäblich die gleiche Frage wie der Link, den ich gepostet habe. Ihr Rat, den Bereich beizubehalten, wird buchstäblich durch den Skalierungsparameter dividiert, sodass Sie die Beziehung zwischen Uniform- und Beta-Dichte aufrufen können. Dies ist eine Beta-Distribution ... wenn Sie sich die Links ansehen, die ich gepostet habe, ist es sehr offensichtlich
Rosalie
Hier ist die Wikipedia-Seite für die Beta-Verteilung ... "Die Beta-Verteilung hat eine wichtige Anwendung in der Theorie der Ordnungsstatistik. Ein grundlegendes Ergebnis ist, dass die Verteilung des k-ten Kleinsten einer Stichprobe der Größe n aus einer kontinuierlichen Gleichverteilung a hat Beta-Verteilung. [51] Dieses Ergebnis wird wie folgt zusammengefasst: U.(k)~β(k, n + 1-k) Daraus und unter Anwendung der Wahrscheinlichkeitsintegraltransformation kann die Verteilung jeder einzelnen Ordnungsstatistik aus jeder kontinuierlichen Verteilung abgeleitet werden. " en.wikipedia.org/wiki/Beta_distribution
Rosalie
3
Vielen Dank - aber das geht nicht auf die Frage ein, die das betrifft Bereich (eine lineare Kombination korrelierter Ordnungsstatistiken) einer bestimmten zugrunde liegenden Verteilung . Wie aus der Frage hervorgeht, steht in diesem Fall eine genaue Formel für die Verteilung des Bereichs zur Verfügung. Der von Ihnen beschriebene Ansatz scheint jedoch kein legitimer Weg zu sein, um diese Verteilung abzuleiten.
whuber
2
Sie machen den Fehler anzunehmen, dass Ihre vielen Downvoter dieses Material nicht verstehen. Ich vermute, dass sie es tun, und unabhängig davon, wie Sie sich fühlen, sollten Sie ihnen die Höflichkeit geben, so viel anzunehmen. Ich möchte meine Einladung (in meinem ursprünglichen Kommentar) wiederholen, Ihre Behauptungen mit einer echten Demonstration eines expliziten Ergebnisses zu untermauern, anstatt lediglich zu behaupten, dass Ihr Standpunkt "leicht" gezeigt wird.
whuber