Brain-Teaser: Was ist die erwartete Länge einer iid-Sequenz, die bei einer gleichmäßigen [0,1] -Verteilung monoton ansteigt?

28

Dies ist eine Interviewfrage für eine quantitative Analystenposition, über die hier berichtet wird . Angenommen, wir zeichnen aus einer gleichmäßigen [0,1] -Verteilung und die Ziehungen lauten: Wie lang ist die erwartete monoton ansteigende Verteilung? Das heißt, wir hören auf zu zeichnen, wenn die aktuelle Auslosung kleiner oder gleich der vorherigen Auslosung ist.

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

Aber ich finde es immer schwieriger, diese verschachtelten Integrale zu berechnen, und ich habe nicht den "Trick", zu zu verallgemeinern . Ich weiß, die endgültige Antwort ist strukturiert. Pr(length=n)

E(length)=n=1nPr(length=n)

Irgendwelche Ideen zur Beantwortung dieser Frage?

Amazonisch
quelle

Antworten:

37

Hier einige allgemeine Hinweise zur Lösung dieser Frage:

Sie haben eine Folge von kontinuierlichen IID-Zufallsvariablen, was bedeutet, dass sie austauschbar sind . Was bedeutet dies für die Wahrscheinlichkeit, eine bestimmte Reihenfolge für die ersten Werte zu erhalten? Wie groß ist die Wahrscheinlichkeit, dass die Reihenfolge für die ersten Werte steigt ? Es ist möglich, dies herauszufinden, ohne die Verteilung der zugrunde liegenden Zufallsvariablen zu integrieren. Wenn Sie dies gut machen, können Sie eine Antwort ableiten, ohne von einer gleichmäßigen Verteilung ausgehen zu müssen, dh Sie erhalten eine Antwort, die für austauschbare Folgen kontinuierlicher Zufallsvariablen gilt.nn


Hier ist die vollständige Lösung ( schauen Sie nicht, ob Sie das selbst herausfinden sollen ):

Sei Ihre Folge von unabhängigen kontinuierlichen Zufallsvariablen, und sei ist die Anzahl ansteigender Elemente am Anfang der Sequenz. Da es sich um fortlaufend austauschbare Zufallsvariablen handelt, sind sie mit ziemlicher Sicherheit ungleich und jede Reihenfolge ist gleich wahrscheinlich. Wir haben also: (Beachten Sie, dass dieses Ergebnis für jede IID-Sequenz kontinuierlicher Zufallsvariablen gilt; sie müssen nicht gleichmäßig verteilt sein.) Die Zufallsvariable hat also eine WahrscheinlichkeitsmassenfunktionU1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
N
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
Sie werden feststellen, dass dieses Ergebnis mit den Werten übereinstimmt, die Sie mithilfe der Integration über die zugrunde liegenden Werte berechnet haben. (Dieser Teil wird für die Lösung nicht benötigt; er ist der Vollständigkeit halber enthalten.) Unter Verwendung einer bekannten Regel für den erwarteten Wert einer nicht negativen Zufallsvariablen haben wir: Beachten Sie erneut, dass in unserer Arbeit nichts die zugrunde liegende gleichmäßige Verteilung verwendet hat. Daher ist dies ein allgemeines Ergebnis, das für jede austauschbare Folge kontinuierlicher Zufallsvariablen gilt.
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

Einige weitere Einblicke:

Aus der obigen Arbeit sehen wir, dass dieses Verteilungsergebnis und der daraus resultierende erwartete Wert nicht von der zugrunde liegenden Verteilung abhängen, solange es sich um eine kontinuierliche Verteilung handelt. Dies ist wirklich nicht überraschend, wenn man bedenkt, dass jede kontinuierliche skalare Zufallsvariable durch eine monotone Transformation einer einheitlichen Zufallsvariablen erhalten werden kann (wobei die Transformation ihre Quantilfunktion ist). Da monotone Transformationen die Rangordnung beibehalten, ist das Betrachten der Ordnungswahrscheinlichkeiten beliebiger kontinuierlicher IID-Zufallsvariablen dasselbe wie das Betrachten der Ordnungswahrscheinlichkeiten einheitlicher IID- Zufallsvariablen.

Setzen Sie Monica wieder ein
quelle
6
Schön gemacht! (+1)
Bogenschütze
1
@Ben Ich folge dir bis zur letzten Gleichung ... Ich dachte, der erwartete Wert sollte, anstatt ... können Sie diesen Teil näher erläutern?
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Amazonian
5
Dies ist eine bekannte Regel für den Erwartungswert einer nicht negativen Zufallsvariablen . Unter Verwendung einer Technik, bei der die Reihenfolge der Summierungen vertauscht wird, haben Sie: Sie sollten also feststellen, dass .
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Setzen Sie Monica am
Können Sie bitte erläutern, warum ? P(Nn)=P(U1<U2<<Un)
Badmax
1
@badmax: Die Zufallsvariable ist die Anzahl der aufsteigenden Elemente von am Anfang der Sequenz (siehe Definition). Wenn also , bedeutet dies, dass am Anfang der Sequenz mindestens ansteigende Elemente vorhanden sind . Dies bedeutet, dass die ersten Elemente in aufsteigender Reihenfolge vorliegen müssen, . NUNnnnU1<U2<<Un
Setzen Sie Monica
8

Eine weitere Lösungsmethode, mit der Sie die Lösung für einen allgemeineren Fall finden.

Angenommen, ist die erwartete Länge einer monotonen Sequenz , sodass . Der zu berechnende Wert ist . Und wir wissen, dass . Konditionierung auf den nächsten Wert,F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

Dabei ist die U [0,1] -Dichte. Soπ(y)=1

F(x)=(1+F(x))

Wenn wir mit der Randbedingung lösen , erhalten wir . Daher ist .F(1)=0F(x)=e(1x)1F(0)=e1

jf328
quelle
2
Das ist sehr klug. Um es ein bisschen auszudrücken: Ihre Beobachtungen sind, dass 1) wenn die Länge der längsten anfänglich zunehmenden Sequenz minus eins ist, es ausreicht, zu bestimmen und und 2) ist Null, wenn und andernfalls. Da wir erhalten , was im einheitlichen Fall direkt gelöst werden kann. LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
Matthew Towers
2
+1 Sehr klug in der Tat. Da die endgültige Antwort jedoch nicht von der Verteilung abhängt (wie in der anderen Antwort beschrieben), sollte diese Berechnung auch nicht von abhängen . Gibt es eine Möglichkeit, es zu sehen? CC an @m_t_. π(y)
Amöbe sagt Reinstate Monica
3
@amoeba Ich bin damit einverstanden, dass nicht von der Verteilung der s abhängen sollte , sondern von anderen Werten von : Die allgemeine Lösung dieser DE istF(0)XFF=Ceπ1
Matthew Towers
1
@MartijnWeterings Ich denke, , nicht 1, z. B. in dem einheitlichen Fall bekommen wirC=eeex1
Matthew Towers
1
Ja, du hast recht. Ich habe die einheitliche Schreibweise verwendet, um meine Aussage abzuleiten, habe aber fälschlicherweise anstelle vonce1x1cex1
Sextus Empiricus
0

Eine andere Lösungsmethode besteht darin, das Integral direkt zu berechnen.

Die Wahrscheinlichkeit, eine Sequenz zu erzeugen, deren zunehmender Teil die Länge von ist , wobei .nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

Wir müssen berechnen .fn(0)

Wenn Sie versuchen, die ersten mehreren zu berechnen , werden Sie vielleicht feststellen, dassfn(x)fn(x)=t=0n(x)tt!(nt)!

Basisfall: Wenn , istn=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

Induktive Hypothese: Wenn , istn=kfn(x)=t=0k(x)tt!(kt)! , for k1

Induktive Stufe: wenn ,n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

Durch die mathematische Induktion gilt die Annahme.

Wir erhalten alsofn(0)=1n!

Also istE(length)=n=1Pr(lengthn)=n=11n!=e1

劉家維
quelle