Blackwells Wette

12

Ich habe über Blackwells Wettparadoxon im Futility-Schrank gelesen . Hier ist die Zusammenfassung: Sie erhalten zwei Umschläge, und . Die Umschläge enthalten einen zufälligen Geldbetrag, aber Sie wissen nichts über die Verteilung des Geldes. Sie öffnen eine, prüfen, wie viel Geld sich dort befindet ( ) und müssen wählen: Nehmen Sie den Umschlag oder ?ExEyxExEy

Futility Closet bezieht sich auf einen Mathematiker namens Leonard Wapner: "Unerwartet gibt es etwas, das Sie tun können, ohne den anderen Umschlag zu öffnen, um sich selbst eine bessere Chance zu geben, es richtig zu machen."

Die Idee, die mir falsch scheint, ist wie folgt: eine Zufallszahl wählen . Wenn , nimm . Wenn , wählen Sie .dd<xExd>xEy

Wapner: „Wenn d zwischen x und y liegt, ist Ihre Vorhersage (wie durch d angegeben) garantiert korrekt. Angenommen, dies tritt mit der Wahrscheinlichkeit p auf. Wenn d kleiner als x und y ist, ist Ihre Vorhersage nur dann korrekt, wenn Ihre gewählte Zahl x die größere der beiden ist. Hier besteht eine 50-prozentige Chance. Wenn d größer als beide Zahlen ist, ist Ihre Vorhersage nur dann korrekt, wenn Ihre gewählte Zahl die kleinere der beiden ist. Dies geschieht ebenfalls mit einer Wahrscheinlichkeit von 50 Prozent. “

Wenn die Wahrscheinlichkeit, dass in ist, größer als Null ist, ist der durchschnittliche Erfolg dieser Methode . Dies würde bedeuten, dass uns die Beobachtung einer unabhängigen Zufallsvariablen zusätzliche Informationen liefert.d[x,y]12+p2

Ich denke, dass das alles falsch ist und dass das Problem in der Wahl einer zufälligen Ganzzahl liegt. Was bedeutet es? Wie eine ganze Zahl? In diesem Fall ist die Wahrscheinlichkeit dass zwischen und liegt, Null, da sowohl als auch endlich sind.d x y x ypdxyxy

Wenn wir sagen, dass es ein Limit für den maximalen Geldbetrag gibt, sagen wir , oder wir wählen mindestens d aus , dann läuft das Rezept auf den trivialen Ratschlag hinaus, wählen, wenn und wähle wenn .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Vermisse ich hier etwas?

BEARBEITEN

OK, jetzt beginne ich zu sehen, woher das scheinbare Paradox kommt. Es schien mir unmöglich, dass eine unabhängige Zufallsvariable zusätzliche Informationen liefern kann.

Beachten Sie jedoch, dass wir bewusst eine Verteilung von d wählen müssen . Wählen Sie zum Beispiel die Grenzen für eine gleichmäßige Verteilung oder der Poissionschen Verteilung usw. Wenn wir für Erdnüsse spielen, haben wir die Verteilung von d für als gleichförmig gewählt Dollar, . Diese letzte Wahrscheinlichkeit wird in erster Linie auf unserem Urteil abhängen , was kann in den Umschlägen sein.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

Mit anderen Worten, wenn die Technik funktioniert, wird die Annahme verletzt, dass wir nicht wissen, wie sich das Geld in den Umschlägen verteilt (wie der Geldbetrag für die Umschläge gewählt wurde). Wenn wir jedoch wirklich nicht wissen, was sich in den Umschlägen befindet, verlieren wir im schlimmsten Fall nichts, wenn wir sie anwenden.

BEARBEITEN 2

Ein anderer Gedanke. Bei gegebenem wählen wir zum Zeichnen von eine kontinuierliche nicht negative Verteilung, so dass . Das dürfen wir, habe ich recht? Wir gehen wie angewiesen vor - wenn , behalten wir den Umschlag, wenn , ändern wir den Umschlag. Die Argumentation ändert sich nicht, je nachdem, wie wir die Verteilung wählen, kann es sein, dass (oder irre ich mich?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Angesichts der Auswahl der Verteilung entspricht das, was wir jetzt tun, einem Münzwurf. Wir werfen eine Münze, und wenn es Köpfe sind, wechseln wir Umschläge, wenn es Schwänze sind, halten wir uns an den Umschlag, den wir halten. Wo irre ich mich

EDIT 3 :

OK, ich verstehe es jetzt. Wenn wir die Wahrscheinlichkeitsfunktion von auf stützen (z. B. wir aus einer gleichmäßigen Verteilung im Bereich , dann ist die Wahrscheinlichkeit nicht unabhängig von .x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( richtige Entscheidung | d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Wenn also (mit der Wahrscheinlichkeit ), ist die Schätzung wie zuvor immer richtig. Wenn jedoch die niedrigere Zahl ist und , dann hat eine höhere Wahrscheinlichkeit, niedriger als als höher als , so dass wir zu einer falschen Entscheidung voreingenommen sind. Gleiches gilt, wenn die höhere der beiden Zahlen ist.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Das heißt, wir müssen den Prozess des Zeichnens von unabhängig von wählen . Mit anderen Worten, wir müssen raten, aus welchen Verteilungsparametern und gezogen werden. Das Schlimmste, was passiert, ist, dass wir immer noch zufällig raten, aber das Beste, was passiert, ist, dass unsere Vermutung richtig war - und dann haben wir einen Vorteil. Wie sollte das besser sein, als zu raten, "x und y werden, denke ich, mindestens 1 $ sein , aber höchstens 10 $ . Wenn also , behalten wir es, und wenn nicht, tauschen wir es", bin ich noch dran sehen.x x y x > 5dxxyx>5

Ich war durch die Pop-Sci-Formulierung des Problems in Wapners Buch ( Unerwartete Erwartungen: Die Kuriositäten einer mathematischen Kristallkugel ) irregeführt , in der es heißt

„Mit welchen Mitteln auch immer, wählen Sie eine zufällige positive ganze Zahl“ (Wapner legt eine geometrische Verteilung - werfen Münzen , bis die ersten Köpfe kommen, um den Prozess zu wiederholen , wenn ) „Wenn höher erraten und wenn guess niedriger. (...) Sie werden mehr als 50 Prozent der Zeit richtig erraten, weil mehr als 50 Prozent der Zeit richtig zeigt! "d > x d < xd=xd>xd<xd

Januar
quelle
1
Sehr eng verbunden: stats.stackexchange.com/questions/95694
whuber
2
Dies unterscheidet sich stark von dem Problem mit zwei Hüllkurven in dem Sinne, dass: (1) das Argument für das Umschalten des Problems mit zwei Hüllkurven trügerisch ist, der Fehler in dem Argument kann durch Hinzufügen eines Bayesian vor während (2) des Arguments gesehen werden von Wapner für Blackwells Wette gegeben ist richtig.
Matthew Gunn
Wenn die Geldbeträge in den Umschlägen willkürliche Elemente einer Reihe von Zahlen S sind, besteht eine ausreichende und notwendige Voraussetzung für Wapners Strategie darin, dass die CDF der Zahl, die Sie wählen, bei S streng ansteigt.
Reinstate Monica
OK, mir fehlt noch etwas - bitte sehen Sie sich meinen EDIT 2 an, aber es sieht für mich so aus, als könnten wir nur eine Münze werfen und es sollte immer noch funktionieren, so die Überlegung. Wo irre ich mich
Januar

Antworten:

8

Dies ist allgemein als das Zwei-Hüllkurven-Problem bekannt . Am häufigsten werden die Beträge als und , es ist jedoch nicht erforderlich, dass dies der Fall ist.2 AA2A

Ein paar Punkte:

  1. Sie können eine zufällige ganze Zahl nicht einheitlich auswählen *, aber für den angegebenen Teil scheint es nicht erforderlich zu sein, dass sie einheitlich ist. Wählen Sie eine Verteilung - es spielt keine Rolle, was für ein Argument sie ist -, solange die Wahrscheinlichkeit besteht, dass sie einen endlichen Wert überschreitet.

  2. Es wäre nicht sinnvoll, bei der angegebenen Entscheidungsregel eine Ganzzahl zu wählen , da das Geld diskret ist, was bedeutet, dass die Chance d = x ungleich Null ist und für diesen Fall nichts aufgeführt ist. (Alternativ können Sie die Regel ändern, um anzugeben, was zu tun ist, wenn sie gleich sind.)d d=x

  3. Abgesehen davon könnten Sie aus einer nicht negativen kontinuierlichen Verteilung auswählen - dann müssen wir uns nicht um Gleichheit kümmern.d

* (Sie können auch keine einheitlich zufällige nicht negative ganze Zahl oder eine einheitlich zufällige positive ganze Zahl wählen.)


Wenn wir sagen, dass es ein Limit für den maximalen Geldbetrag gibt, sagen wir , oder wir wählen mindestens d aus 1 ... M , dann läuft das Rezept auf den trivialen Ratschlag hinaus, E y zu wählen, wenn x < M / 2 und wählen Sie E x, wenn x > M / 2Md1...MEyx<M/2Exx>M/2

Wenn sich herausstellt, dass die Zufallsverteilung, aus der ausgewählt wird, M / 2 umfasst, sollte dies funktionieren (besser als 50-50). Wenn die Verteilung in einer Hälfte stecken bleibt, würde dies nicht der Fall sein.xM/2

Die Version dieses Spiels, mit der ich zum ersten Mal konfrontiert wurde, ist jedoch, dass der Umschlag von jemandem präsentiert wird, der (möglicherweise) versucht, Ihr Einkommen aus dem Spiel zu minimieren. Die Strategie, mithilfe einer Verteilung zu entscheiden, ob auf den anderen Umschlag gewechselt werden soll, funktioniert in dieser Instanz weiterhin.

Glen_b - Setzen Sie Monica wieder ein
quelle
OK, Punkte (1-3) vergeben. Ich darf also eine solche zufällige, nicht negative, kontinuierliche Verteilung von wählen, dass P ( d < x ) = P ( d > x ) , richtig? Aber dann basiert die Entscheidung im Wesentlichen auf einem Münzwurf ... irre ich mich? dP(d<x)=P(d>x)
Januar
Sie benötigen überhaupt nicht . Sie brauchen nur eine Wahrscheinlichkeit ungleich Null, um zwischen die beiden Beträge zu gelangen. P(d<x)=P(d>x)
Glen_b -Reinstate Monica
Ja, aber ich darf die Dichtefunktion für nach Belieben definieren, oder? Ich mache das, um das Argument zu einer absurden Schlussfolgerung zu führen. d
Januar
Indem Sie Ihre Strategie zu einer Funktion von x machen, geben Sie sich nicht den Vorteil, die richtige Wahl zu treffen, wenn d zwischen x und y liegt - Sie bestimmen Ihren Weg, um das Spiel zu gewinnen. Wenn der Link, den Sie
angeben
Was verbietet es mir nach Wapners Überlegung, die Wahrscheinlichkeitsfunktion zu definieren, die verwendet wird, um als Funktion von x abzuleiten ? Solange P ( d ( x , y ) ) > 0 ist , sollte seine Argumentation immer noch funktionieren, irre ich mich? Wenn ich eine kontinuierliche, nicht negative Verteilung verwende, die x enthält (z. B. eine gleichmäßige Verteilung auf ( 1 , 2 x ) , ist dies garantiert. Und ich treffe trotzdem die richtige Entscheidung, ob d ( x , y) ist ) .dxP(d(x,y))>0x(1,2x)d(x,y)
Januar
7

Wapners Argument ist richtig!

Einige Kommentare:

  • Befolgen Sie die beschriebene Abschneidestrategie, bei der wir die Hüllkurven wechseln, wenn für die Ex-ante-Erwartung im schlimmsten Fall unbrauchbar ist. Mit einer guten Wahl von d kann es sehr nützlich sein.x<dd
  • Wenn Sie einen Bayesianischen Prior hinzufügen (dh Sie fügen Überzeugungen über die anfängliche Verteilung des Geldes in den Umschlägen hinzu), können Sie den optimalen Wert von Berücksichtigung Ihrer früheren Überzeugungen ermitteln.d
  • In bestimmten Situationen (z. B.: Je mehr Sie beobachten, desto wahrscheinlicher ist es, dass Sie den großen Umschlag haben) ist eine Abschneidestrategie sogar optimal.
  • In einer allgemeineren Bayes'schen Umgebung können Sie für viele Vorgänger bessere Ergebnisse erzielen als mit einer einfachen Abschaltstrategie.

Ein verwandtes, aber anderes Problem:

Wie mehrere @Glen_b und @whuber bereits erwähnt haben, gibt es ein verwandtes Rätsel, das als Two Envelope Problem bekannt ist, bei dem ein trügerisches Argument für das ständige Umschalten von Umschlägen angeführt wird Inhalt der beiden Umschläge.

In gewissem Sinne ist das hier beschriebene Puzzle jedoch etwas anders. Wapners Argument ist richtig!

Matthew Gunn
quelle
1
OK, jetzt sehe ich, woher das Paradox kommt. Oder um genau zu sein, wo die zusätzlichen Informationen in das System fließen. Durch die bewusste Wahl der Verteilung von d nutzen wir unser Wissen von vornherein, wo sich mehr oder weniger die Geldbeträge in beiden Umschlägen befinden sollten. Im schlimmsten Fall ist unser Wissen nutzlos, aber die Methode garantiert, dass wir bei der Verwendung nicht im Nachteil sind.
Januar
Nach einigem Nachdenken, ich kann es immer noch nicht bekommen - siehe EDIT 2.
Januar
Szenario (A) Stellen Sie sich vor, der kleine Umschlag hat und der große Umschlag hat 20 . Wählen wir d = 15. P ( x < d ) = P ( x > d ) . Die Entscheidungsregel würde Sie in 100% der Fälle zur richtigen Wahl führen! 1020dP(x<d)=P(x>d)
Matthew Gunn
Betrachten wir nun ein Szenario (B). Stellen Sie sich vor, der kleine Umschlag hat eine ungerade Anzahl von 1 bis 9 Dollar (z. B. 1 oder 3 oder 5 oder 7 oder 9) und der große Umschlag hat 1 Dollar mehr. Wählen Sie und dann P ( x < d ) = P ( x > d ) . Hier klicken Sie jedoch erneut, wenn die Entscheidungsregel < 5.5 nicht so hilfreich ist! Es führt zu der richtigen Entscheidung , wenn x = 1 , 3 , 5 , 6 , 8 , oder 10 und die falschen Entscheidung , wenn xd=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10 . Denken Sie daran, dass die möglichen Paare (1,2), (3, 4), (5, 6), (7, 8) (9, 10) sind ungerade Menge Geld. x=2,4,7,9
Matthew Gunn
Wir kennen die Verteilung von und y nicht und können sie daher nicht so auswählen, wie Sie es vorschlagen. Sobald wir den Umschlag geöffnet haben, kennen wir x , aber wir haben keine Ahnung, dass er zufällig aus den Zahlen 1 bis 9 ausgewählt wurde, und daher können wir d nicht als 5.5 auswählen . Wie von @Glen_b oben erwähnt, muss d aus einer nicht negativen, kontinuierlichen Verteilung ausgewählt werden. xyxdd
Januar
0

Ich war davon fasziniert und verfolgte den pragmatischen Ansatz, damit in Excel zu spielen.

Ich habe drei Zufallszahlen für x, y und d im Bereich von 1 bis 100 generiert. Ich habe dann den Vergleich zwischen d und x und zwischen x und y durchgeführt und mir das Ergebnis angesehen, richtig oder falsch.

Ich habe das 500 Mal gemacht und das mehrmals wiederholt und regelmäßig die richtige Antwort von 330 von 500 erhalten, wie vorhergesagt.

Ich habe dann den Bereich von d auf 1-10000 erhöht und die richtige Antwort ist für 500 Läufe auf ca. 260 gefallen.

Also ja, die Auswahl von d ist abhängig von den erwarteten Werten von x und y.

Bob

user121909
quelle
0

Ich denke, das scheinbare Paradoxon bei der Wapner-Erweiterung der Gleichung p + (1-p) / 2 ist, dass angenommen wird, dass (1-p) / 2> 0 ist. Für viele Bereiche von d ist dieser Wert 0.

Beispiel: Jedes d, das aus einer symmetrischen Verteilung ausgewählt wird, die auf den Wert in der offenen Hüllkurve zentriert ist, gibt eine Wahrscheinlichkeit von 1/2 falsch und 1/2 richtig.

Jede asymmetrisch gewählte Verteilung scheint die Wahl um die Hälfte der Zeit falsch zu beeinflussen.

Gibt es also eine Möglichkeit, einen Bereich und eine Verteilung für d so zu wählen, dass diese Gleichung gilt?

Terry
quelle