Lassen Sie einen Stab der Länge 1 gleichmäßig zufällig in Fragmente zerbrechen . Wie ist die Verteilung der Länge des längsten Fragments?
Genauer gesagt, sei IID , und sei die zugehörige Ordnungsstatistik, dh wir ordnen einfach die Probe so, dass . Sei .
Ich interessiere mich für die Distribution von . Momente, asymptotische Ergebnisse oder Näherungen für sind ebenfalls interessant.
Antworten:
Mit den Informationen von @Glen_b konnte ich die Antwort finden. Verwenden Sie die gleichen Notationen wie die Frage
Dabei ista+=a wenn a>0 und sonst 0 . Ich gebe auch die Erwartung und die asymptotische Konvergenz für die Gumbel- Distribution ( NB : nicht Beta) an
Das Material der Proofs stammt aus mehreren Veröffentlichungen, die in den Referenzen verlinkt sind. Sie sind etwas langwierig, aber unkompliziert.
1. Nachweis der genauen Verteilung
Sei IID gleichförmige Zufallsvariablen im Intervall . Indem wir sie bestellen, erhalten wir die mit bezeichneten Ordnungsstatistiken . Die einheitlichen Abstände sind definiert als , mit und . Die geordneten Abstände sind die entsprechenden geordneten Statistiken . Die interessierende Variable ist .(U1,…,Uk) (0,1) k (U(1),…,U(k)) Δi=U(i)−U(i−1) U(0)=0 U(k+1)=1 Δ(1)≤…≤Δ(k+1) Δ(k+1)
Für festes definieren wir die Indikatorvariable . Aufgrund der Symmetrie ist der Zufallsvektor austauschbar, sodass die gemeinsame Verteilung einer Teilmenge der Größe der gemeinsamen Verteilung von entspricht der erste . Durch die Erweiterung des Produktes erhalten wir somitx∈(0,1) 1i=1{Δi>x} (11,…,1k+1) j j
Wir werden nun beweisen, dass , wodurch die oben angegebene Verteilung erstellt wird. Wir beweisen dies für , da der allgemeine Fall ähnlich bewiesen ist.E(∏ji=11i)=(1−jx)k+ j=2
Wenn , liegen die Haltepunkte im Intervall . In diesem Fall sind die Haltepunkte noch austauschbar, sodass die Wahrscheinlichkeit, dass der Abstand zwischen dem zweiten und dem ersten Haltepunkt größer als ist, mit der Wahrscheinlichkeit identisch ist, dass der Abstand zwischen dem ersten Haltepunkt und der linken Barriere (an Position ) ist größer als . SoΔ1>x k (x,1) x x x
2. Erwartung
Für Distributionen mit endlicher Unterstützung haben wir
Durch Integration der Verteilung von erhalten wirΔ(k+1)
Die letzte Gleichheit ist eine klassische Darstellung der harmonischen Zahlen , die wir unten demonstrieren.Hi=1+12+…+1i
Mit der Änderung der Variablen und der Erweiterung des Produkts erhalten wiru=1−x
3. Alternative Konstruktion gleichmäßiger Abstände
Um die asymptotische Verteilung des größten Fragments zu erhalten, müssen wir eine klassische Konstruktion einheitlicher Abstände als Exponentialvariablen dividiert durch ihre Summe zeigen. Die Wahrscheinlichkeitsdichte der zugehörigen Ordnungsstatistik beträgt(U(1),…,U(k))
Wenn wir die gleichmäßigen Abstände , erhalten wir mitΔi=U(i)−U(i−1) U(0)=0
Durch die Definition von wir alsoU(k+1)=1
Nun sei eine exponentielle IID-Zufallsvariable mit dem Mittelwert 1 und sei . Mit einer einfachen Änderung der Variablen können wir das sehen(X1,…,Xk+1) S=X1+…+Xk+1
Definiere , so dass wir durch eine Änderung der Variablen erhaltenYi=Xi/S
Durch Integration dieser Dichte in Bezug auf wir alsos
Die gemeinsame Verteilung von gleichmäßigen Abständen im Intervall ist also die gleiche wie die gemeinsame Verteilung von exponentiellen Zufallsvariablen geteilt durch ihre Summe. Wir kommen zur folgenden Äquivalenz der Verteilungk+1 (0,1) k+1
4. Asymptotische Verteilung
Unter Verwendung der obigen Äquivalenz erhalten wir
Dabei ist . Diese Variable verschwindet wahrscheinlich, weil und . Asymptotisch ist die Verteilung dieselbe wie die von . Weil die IID sind, haben wirTk+1=X1+…+Xk+1k+1−1 E(Tk+1)=0 Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0 X(k+1)−log(k+1) Xi
5. Grafische Übersicht
Das folgende Diagramm zeigt die Verteilung des größten Fragments für verschiedene Werte von . Für ich auch die asymptotische Gumbelverteilung (dünne Linie) überlagert. Das Gumbel ist eine sehr schlechte Näherung für kleine Werte von so dass ich sie weglasse, um das Bild nicht zu überladen. Die Gumbel-Näherung ist gut von .k k=10,20,50 k k≈50
6. Referenzen
Die obigen Beweise sind den Referenzen 2 und 3 entnommen. Die zitierte Literatur enthält viel mehr Ergebnisse, wie die Verteilung der geordneten Abstände eines beliebigen Ranges, ihre Grenzverteilung und einige alternative Konstruktionen der geordneten gleichmäßigen Abstände. Die wichtigsten Verweise sind nicht leicht zugänglich, daher biete ich auch Links zum Volltext an.
quelle
Dies ist keine vollständige Antwort, aber ich habe einige schnelle Simulationen durchgeführt, und das habe ich erhalten:
Dies sieht bemerkenswert Beta-artig aus, und dies ist ein wenig sinnvoll, da die Ordnungsstatistik der IID-Gleichverteilungen Beta- Wiki ist .
Dies könnte einen Ansatzpunkt geben, um das resultierende PDF abzuleiten.
Ich werde aktualisieren, wenn ich zu einer endgültigen geschlossenen Lösung komme.
Prost!
quelle
Ich habe die Antwort für eine Konferenz in Siena (Italien) im Jahr 2005 erstellt. Der Artikel (2006) ist auf meiner Website hier (pdf) zu finden . Die genauen Verteilungen aller Abstände (kleinste bis größte) finden Sie auf den Seiten 75 und 76.
Ich hoffe, auf der RSS-Konferenz im September 2016 in Manchester (England) einen Vortrag zu diesem Thema halten zu können.
quelle