Optimale Zufallsgebote

7

Diese Frage stammt von dieser Website, die ich oft durchforste.

Zwei Spieler spielen eine heiße neue Spielshow mit dem Titel "Higher Number Wins". Die beiden gehen in separate Kabinen und drücken jeweils eine Taste. Auf einem Bildschirm wird eine Zufallszahl zwischen Null und Eins angezeigt. (Zu diesem Zeitpunkt kennt keiner die Nummer des anderen, aber er weiß, dass die Nummern aus einer einheitlichen Standardverteilung ausgewählt wurden.) Sie können diese erste Nummer behalten oder die Taste erneut drücken, um die erste Nummer zu verwerfen und eine zweite zu erhalten Zufallszahl, die sie behalten müssen. Dann kommen sie aus ihren Kabinen und sehen die endgültige Nummer für jeden Spieler an der Wand. Der verschwenderische Hauptpreis - ein Fall voller Goldbarren - wird an den Spieler vergeben, der die höhere Zahl behalten hat. Welche Zahl ist der optimale Grenzwert für Spieler, um ihre erste Zahl zu verwerfen und eine andere zu wählen? Anders ausgedrückt: In welchem ​​Bereich sollten sie die erste Zahl behalten?

Dies ist entweder ein sehr seltsames Auktionsproblem bei symmetrischen Spielern (ich gehe auch davon aus, dass die Spieler risikoneutral sind) oder ein sehr seltsames Lotterie- / Spieltheorie-Spiel.

Wie würden Sie diese Frage mathematisch angehen und welche Antwort erhalten Sie darauf? Es gibt keinen Preis für mich , die richtige Antwort auf das Rätsel der Website zu bekommen. Ich bin nur neugierig. Meine Intuition sagt mir, dass der optimale Cutoff 0,5 beträgt, da Sie eine 50: 50-Chance haben, höher oder niedriger als die Zahl Ihres Gegners zu sein, unabhängig davon, ob er / sie seine Zufallszahl wiederholt oder nicht, aber ich bin nicht sicher.

Kitsune Kavallerie
quelle
Ich denke nicht, dass Risikoneutralität etwas damit zu tun hat. Die Spieler versuchen einfach, ihre Gewinnwahrscheinlichkeit zu maximieren. Auszahlungen sind binär, es gibt keine sicheren Durchschnittsergebnisse.
Giskard
@denesp Sie könnten in dem Sinne risikoscheu sein, dass Sie beim Zeichnen von beispielsweise 0,46 möglicherweise nicht neu zeichnen möchten, obwohl Sie eine bessere Chance haben, eine bessere Zahl als eine schlechtere zu erhalten.
Kitsune Kavallerie
1
@KitsuneCavalry Ich verstehe, was Sie sagen, aber das wäre ein "Verhaltensbegriff" der Risikoaversion, da er eher über einen Zwischenschritt als über die Endergebnisse definiert wird.
Shane
@ Shane Sicher, ich höre dich. Und ich mache mir sowieso keine allzu großen Sorgen.
Kitsune Kavallerie

Antworten:

6

Zuerst werde ich nur zeigen, dass die 0,5 (oder 12 ) Der Grenzwert funktioniert nicht als symmetrisches Gleichgewicht. Dann können Sie selbst entscheiden, ob Sie über das Problem nachdenken oder die vollständige Antwort lesen möchten.

Bezeichnen wir die Grenzpunkte mit cx,cy . Angenommen, beide Spieler verwenden die Strategie c=12 . Bezeichnen wir die Anzahl der Spielerxundymitx1undy1und ihre potenzielle zweite Zahl mitx2undy2. Angenommen,x1=23 . Wenn Sie dies beibehalten,beträgtdie Wahrscheinlichkeit, dass Spielerxgewinnt,

P.(12y1<23)+P.(y1<12)P.(y2<23)=16+1223=12.
Dies bedeutet auch, dass23 istder Median dieser Verteilung.

Nehmen wir nun an, x1=12 . Wenn Sie dies beibehalten,istdie Wahrscheinlichkeit, dass Spielerxgewinnt,

P.(y1<12)P.(y2<12)=1212=14
Aber wenn erx1=1verwerfen würdex1=12 er hat die Wahrscheinlichkeit
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
zu gewinnen. 38>14 alsox1=12 (und seine Umgebung) ist nicht optimal, daher kann es keine Gleichgewichtsbewegung sein.


SPOILER ALARM

Wenn Spieler y einen Cut-Off cy und Spieler xx1=cy zieht und es behält, ist die Wahrscheinlichkeit, dass Spieler x gewinnt,

P(y1<cy)P(y2<cy)=cycy=cy2.
Wenn Spieler x wo zu verwerfen x1 die Wahrscheinlichkeit , dass er gewinnt , ist
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
Angenommen, es gibt ein symmetrisches Gleichgewicht, dhcx=cy=c.
(Ich glaube nicht, dass andere Gleichgewichte existieren, aber ich habe es nicht bewiesen.)
Da die Gewinnwahrscheinlichkeit im Wert vonx1stetig ist, ist der Grenzwertcso, dass wennx1=cist, die Gewinnwahrscheinlichkeit ist gleich, wennx1beibehalten und verworfen wird. Dies bedeutet, dass
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.

Giskard
quelle
Jemand hat eine ähnliche Ableitung wie Sie durchgeführt und diese Wolfram-Berechnung durchgeführt, um sie noch einmal zu überprüfen: tinyurl.com/j9xey5t Also werde ich weitermachen und sagen, dass dies richtig aussieht. Wenn Sie nun die allgemeine Form dieses Spiels lösen, gebe ich Ihnen die beste Antwort: P Scherz ~ (Obwohl es interessant wäre zu sehen, wie sich das Spiel mit mehr Chancen auf ein erneutes Rollen ändert.) Bedeutet Ihr bearbeiteter Cutoff, dass beide Spieler 50 haben % des Gewinns, oder glauben Sie immer noch, dass Ihre Antwort einen Fehler enthält?
Kitsune Kavallerie
@ KitsuneCavalry Ich denke, es zu akzeptieren war etwas verfrüht, aber zum Glück ist die Berechnung korrekt und meine Argumentation über die 50% war falsch. Der Cut-Off ist so hoch, dass das Zeichnen "Glück" ist und Sie dadurch eine Gewinnchance von mehr als 50% haben, wenn Sie es ziehen. Vor der Ziehung haben Sie genau 50%.
Giskard
Wenn es für irgendetwas zählt, gab die Site, die die Frage gestellt hat, die Antwort. Du hast es auf das Geld bekommen. Fühlen Sie sich heute wie ein Gewinner. Du hast es dir verdient B)
Kitsune Cavalry
2

Angenommen, Person 1 wählt einen Grenzwert von und Person 2 wählt einen Grenzwert von c 2 , wobei c 2c 1 ist . Sei p 1 ( x ) die Wahrscheinlichkeit, dass die endgültige Zahl von Person 1 nicht größer als x ist . p 1c1c2c2c1p1(x)x gleich c 1 x, wenn x < c 1 und c 1 x + x - c 1 ansonsten. Definiere p 2 (p1(x)c1xx<c1c1x+x- -c1 ähnlich. Zeichnen Sie nun p 2 ( x ) gegen p 1 ( x ) auf einem parametrischen Diagramm für 0 x 1 . Das Ergebnis sind drei Liniensegmente:p2(x)p2(x)p1(x)0x1

  • Eins von bis ( c 2 1 , c 1 c 2 ) , entsprechend 0 x c 1 ;(0,0)(c12,c1c2)0xc1
  • Eine von bis ( c 1 c 2)(c12,c1c2) , entsprechend c 1x c 2 ;(c1c2+c2- -c1,c22)c1xc2
  • Eine von bis ( 1 , 1 ) , entsprechend c 2x 1 .(c1c2+c2- -c1,c22)(1,1)c2x1

Diese drei Liniensegmente teilen das Einheitsquadrat in zwei Teile. Die Fläche des Teils unter dem Diagramm ist die Wahrscheinlichkeit, dass Person 1 die höhere Zahl hat. Einige Geometrien zeigen, dass dieser Bereich . Damit ein stabiles Gleichgewicht besteht, müssen beide partiellen Ableitungen davon Null sein, dh1-c2-2c1c2+c 2 2 =012+12(c2- -c1)(c1c2+c2- -1)

1- -c2- -2c1c2+c22=0- -1- -c1+2c2- -c12+2c1c2=0

Das Addieren der Gleichungen zeigt, dass , was nur möglich ist, wenn c 1 = c 2 ist . Einsetzen in eine der Gleichungen, 1(c2- -c1)(1+c1+c2)=0c1=c21- -c1- -c12=0c1=c2=5- -12

f ''
quelle
Dies ist eine gute Antwort, aber warum nennt man das Gleichgewicht ein stabiles Gleichgewicht?
Giskard
1
@denesp Ich denke, das ist überflüssig.
f