Gleichmäßig zufälliges Zeichnen von n Intervallen, Wahrscheinlichkeit, dass sich mindestens ein Intervall mit allen anderen überschneidet

17

Zeichnen Sie zufällig Intervalle aus , wobei jeder Endpunkt A, B aus der gleichmäßigen Verteilung zwischen .n[0,1][0,1]

Wie groß ist die Wahrscheinlichkeit, dass sich mindestens ein Intervall mit allen anderen überschneidet?

Vendetta
quelle
Sie können sich die Wahrscheinlichkeit ansehen, dass das zuletzt gezogene kleiner als das Minimum von allen zuvor gezogenen , und die Wahrscheinlichkeit, dass das letzte größer als das Maximum von allen zuvor gezogenenAnABnB . Das sollte hilfreich sein. Erhöhen Sie dann die Wahrscheinlichkeit, um die Tatsache zu erklären, dass wir nicht den letzten , sondern einen anderen benötigen . (Ich habe nicht die Zeit, es
durchzuarbeiten
Es kann etwas überraschend sein, dass (1) die Antwort nicht von der Verteilung abhängt (nur dass sie stetig ist) und (2) für n>1 konstant ist!
whuber
1
Ist das n- te Intervall so aufgebaut: i) Ziehe aus [0,1] zwei Zahlen gleichmäßig zufällig, ii) sei die kleinere An und die größere Bn ?
ekvall

Antworten:

5

In diesem Beitrag wird die Frage beantwortet und ein Teil der Fortschritte bei der Prüfung der Richtigkeit beschrieben.


Für ist die Antwort trivial 1 . Für alle größeren n ist es ( überraschend) immer 2 / 3 .n=11n2/3

Um zu sehen, warum, stellen Sie zunächst fest, dass die Frage auf jede stetige Verteilung (anstelle der gleichmäßigen Verteilung) verallgemeinert werden kann . Der Prozess, durch den die n Intervalle erzeugt werden, entspricht dem Zeichnen von 2 n iid, das X 1 , X 2 , ... , X 2 n von F abweicht und die Intervalle bildetFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Da alle des X i unabhängig sind, sind sie austauschbar. Dies bedeutet, dass die Lösung dieselbe wäre, wenn wir alle zufällig permutieren würden. Bedingen wir also die durch Sortieren des X i erhaltene Ordnungsstatistik :2nXiXi

X(1)<X(2)<<X(2n)

(Wo, weil stetig ist, gibt es keine Chance, dass zwei gleich sind). Die n Intervalle werden gebildet, indem eine zufällige Permutation σ S 2 n ausgewählt und paarweise verbunden werdenFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Ob sich zwei davon überlappen oder nicht, hängt nicht von den Werten von ,X(i) da die Überlappung durch irgendeine monotone Transformation erhalten bleibt und es solche Transformationen gibt, die X ( i ) zu i senden . Ohne Verlust der Allgemeinheit können wir also X ( i ) = i nehmen und die Frage lautet:f:RRX(i)iX(i)=i

Die Menge sei in n disjunkte Dubletten unterteilt. Zwei beliebige von ihnen, { l 1 , r 1 } und { l 2 , r 2 } (mit l i < r i ), überlappen sich, wenn r 1 > l 2 und r 2 > l 1{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1. Angenommen, eine Partition ist "gut", wenn mindestens eines ihrer Elemente alle anderen überlappt (und ansonsten "schlecht" ist). Wie hoch ist der Anteil guter Partitionen in Abhängigkeit von ?n

Betrachten Sie zur Veranschaulichung den Fall . Es gibt drei Partitionen,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

von denen die zwei guten (die zweite und die dritte) rot gefärbt sind. Somit ist die Antwort im Fall ist 2 / 3 .n=22/3

Wir können solche Partitionen grafisch darstellen durch die Punkte Plotten { 1 , 2 , ... , 2 n } auf einer Zahlengeraden und Zeichenliniensegmente zwischen jedem L i und r i ,verschmieren sie leicht visuelle Überlappungen zu lösen. Hier sind Diagramme der vorhergehenden drei Partitionen in derselben Reihenfolge mit derselben Färbung:{{li,ri},i=1,2,,n}{1,2,,2n}liri

Abbildung 1

Von nun an drehe ich sie zur Seite, um solche Zeichnungen in dieses Format zu integrieren. Zum Beispiel sind hier die Partitionen für n = 3 , noch einmal mit den guten, die rot gefärbt sind:15n=3

Figur 2

Zehn gut sind, so ist die Antwort für ist , 10 / 15 = 2 / 3 .n=310/15=2/3

Die erste interessante Situation tritt auf, wenn . Jetzt ist es zum ersten Mal möglich, dass die Vereinigung der Intervalle 1 bis 2 n umfasst, ohne dass eines der Intervalle die anderen schneidet. Ein Beispiel ist { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . Die Vereinigung der Liniensegmente verläuft ungebrochen von 1 bis 8n=412n{{1,3},{2,5},{4,7},{6,8}}18Dies ist jedoch keine gute Partition. Trotzdem der 105 Partitionen sind gut und der Anteil bleibt 2 / 3 .701052/3


Die Anzahl der Partitionen steigt mit rapide an : Sie entspricht 1 3 5 2 n - 1 = ( 2 n ) ! / ( 2 n n ! ) . Erschöpfende Aufzählung aller Möglichkeiten durch n = 7 weiterhin ergeben 2 / 3 als Antwort. Monte-Carlo-Simulationen mit n = 100 (jeweils 10000 Iterationen) zeigen keine signifikanten Abweichungen von 2n1352n1=(2n)!/(2nn!)n=72/3n=10010000 .2/3

Ich bin überzeugt, dass es eine clevere und einfache Methode gibt, um zu demonstrieren, dass es immer ein Verhältnis zwischen guten und schlechten Partitionen gibt, aber ich habe keine gefunden. Ein Beweis ist durch sorgfältige Integration (unter Verwendung der ursprünglichen Gleichverteilung des X i ) verfügbar , aber er ist ziemlich kompliziert und nicht aufschlussreich.2:1Xi

whuber
quelle
Sehr cool. Es fällt mir schwer zu verstehen, was es heißt, "die Auftragsstatistik zu bestimmen". Wäre es möglich, eine Intuitionslinie hinzuzufügen? Scheint eine nützliche Technik zu sein. Ich verstehe , dass bis zu dem austauschbar sind, ja sogar i i d , dass , dass diese uns jede Permutation zu prüfen erlaubt. Xiiid
ekvall
1
@Student "Bedingung ein" bedeutet zu sagen, dass wir diese Werte vorübergehend festhalten und überlegen, was wir daraus lernen können. Später lassen wir diese Werte variieren (entsprechend ihrer Wahrscheinlichkeitsverteilung). In diesem Fall , wenn wir feststellen , dass die Antwort ist unabhängig von den festen Werten der Auftragsstatistik, dann müssen wir nicht mehr den zweiten Schritt führen die Auftragsstatistik zu variieren. Mathematisch gesehen sind die Ordnungsstatistiken eine vektorielle Variable X und der Indikator für das Gute ist Y , also E ( Y ) = E ( E ( Y | X ) ) = E2/3 XY
E(Y)=E(E(Y|X))=E(2/3)=2/3.