Umschlagparadoxon

8

Es gibt zwei Umschläge. Einer enthält Geld und der andere enthält Geldbetrag. Die genaue Menge " " ist mir unbekannt, aber ich kenne die oben genannten. Ich nehme einen Umschlag und öffne ihn. Ich sehe Geld darin, offensichtlich wo .x2xxyy{x,2x}

Jetzt wird mir angeboten, Umschläge aufzubewahren oder zu wechseln.

Der erwartete Wert für das Umschalten ist . Der erwartete Wert für die Aufbewahrung meines Umschlags ist .(122y+1212y)=54yy

Es scheint, dass ich immer Umschläge wechseln sollte. Meine zwei Fragen:

Ist diese Argumentation richtig?

Ist es anders , wenn ich nicht erlaubt bin den Umschlag zu öffnen und die sieht Menge an Geld, und dann bin ich die Möglichkeit, auf unbestimmte Zeit zu wechseln?y

Kitsune Kavallerie
quelle
1
Sie können nicht einfach die Erwartung annehmen, sondern sollten mit Überzeugungen über x beginnen und Ihre Überzeugungen gemäß der Bayes-Regel aktualisieren. Sobald Sie y sehen, hat sich Ihre Überzeugung, welchen Umschlag Sie geöffnet haben, geändert.
HRSE
Angenommen, x ist gleichmäßig zwischen 0 und . Dann was?
Kitsune Kavallerie
@ KitsuneCavalry Es gibt keine solche Verteilung. (Bitte senden Sie mir ein Programm, das eine solche Verteilung generiert.) Tatsächlich gibt es keine Auflösung, die die in Ihrer Frage angegebenen Grundüberzeugungen für alle Werte von generiert . Im Link von Herrn K. wird dies in en.wikipedia.org/wiki/…y
Giskard
3
@ Kitsune Cavalry Die gleichmäßige Verteilung über die halbe Linie (oder die gesamte Linie) ist ein bekannter Fehler in der Bayes'schen Statistik, siehe Geschmacksstatistik.stackexchange.com/a/97790/28746 oder stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

Antworten:

5

Hier ist ein "erwarteter Nutzenmaximierungs- / spieltheoretischer" Ansatz für die Angelegenheit (mit einem Schuss satztheoretischer Wahrscheinlichkeit). In einem solchen Rahmen erscheinen die Antworten klar.

LOKAL

In absoluter Ehrlichkeit wird uns gesagt, dass für einen streng positiven Geldbetrag die folgenden zwei Tickets in eine Box gelegt wurden: mit der zugewiesenen Identifikationsnummer und mit zugewiesener Identifikationsnummer . Dann wurde eine Ziehung aus einer Bernoulli- Zufallsvariablen ausgeführt, und basierend auf dem Ergebnis und dem aufgetretenen Ereignis wurden die Beträge und in die Umschläge und . Uns wird nicht gesagt, was der Wert von ist oder welcher Betrag zu welchem ​​Umschlag ging.{ A = x , B = 2 x } 1 { A = 2 x , B = x } 0 ( p = 0,5 ) x 2 x A B xx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x2xABx

Erster Fall: Wählen Sie einen Umschlag mit der Option, zu wechseln, ohne ihn zu öffnen

Die erste Frage ist, wie wir einen Umschlag auswählen . Dies hat mit Vorlieben zu tun. Nehmen wir also an , wir erwarten Utility-Maximierer mit der Utility-Funktion .u()

Wir können die probabilistische Struktur hier modellieren, indem wir zwei dichotome Zufallsvariablen betrachten, und die die Hüllkurven darstellen, und die Menge in ihnen. Die Unterstützung von jedem ist . Aber sie sind nicht unabhängig. Wir müssen also mit der gemeinsamen Verteilung beginnen. In Tabellenform sind die gemeinsame Verteilung und die entsprechenden RandverteilungenB { x , 2 x }AB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Dies sagt uns, dass und identische Randverteilungen haben.B.AB

Dies bedeutet jedoch, dass es keine Rolle spielt, wie wir Umschläge auswählen, da wir immer den gleichen erwarteten Nutzen erhalten .

0.5u(x)+0.5u(2x)

Was wir hier sehen, ist ein zusammengesetztes Glücksspiel (wie man einen Umschlag auswählt) gegenüber zwei identischen Glücksspielen (jeder Umschlag). Wir können mit der Wahrscheinlichkeit , oder irgendetwas dazwischen wählen (und komplementär für ). Es spielt keine Rolle. Wir werden immer den gleichen erwarteten Nutzen erhalten. Beachten Sie, dass unsere Einstellung zum Risiko hier keine Rolle spielt.1 0 B.A10B

Also wählen wir einen Umschlag, sagen wir , und schauen ihn uns an. Was ist jetzt unser erwarteter Nutzen? Genau das gleiche wie vor der Auswahl . Das Auswählen eines Umschlags auf irgendeine Weise hat keinen Einfluss auf die Wahrscheinlichkeiten dessen, was sich darin befindet.A

Wir dürfen wechseln. Sagen wir es tun, und jetzt halten wir Umschlag . Was ist jetzt erwartet Nutzen? Genau das gleiche wie zuvor .B

Dies sind die beiden möglichen Zustände der Welt für uns: Wählen Sie oder wählen . Bei jeder Wahl implizieren beide Staaten der Welt den gleichen Wert für unsere gewählte / angenommene treibende Kraft (dh maximieren den erwarteten Nutzen).B.AB

Hier ist es uns also gleichgültig, zu wechseln. und in der Tat könnten wir auch randomisieren.

2. FALL: ÖFFNEN DES UMSCHLAGS mit der Option, danach zu wechseln

Angenommen, wir haben , geöffnet und innerhalb des Betrags . Ändert dies die Dinge? y { x , 2 x }Ay{x,2x}

Wir werden sehen. Ich frage mich, was ist

P(A=xA{x,2x})=?

Nun, ist der Probenraum, auf dem die Zufallsvariable definiert ist. Die Konditionierung des gesamten Probenraums, dh der trivialen Sigma-Algebra, beeinflusst weder die Wahrscheinlichkeiten noch die erwarteten Werte. Es ist, als ob wir uns fragen: "Was ist der Wert von wenn wir wissen, dass alle möglichen Werte realisiert wurden?" Es wurden keine effektiven Kenntnisse gewonnen, daher befinden wir uns immer noch in der ursprünglichen Wahrscheinlichkeitsstruktur. {x,2x}AA

Aber ich frage mich auch, was ist

P(B=xA{x,2x})=?

Die Konditionierungsanweisung, die richtig als Sigma-Algebra betrachtet wird, die durch das Ereignis , ist der gesamte Produktprobenraum, auf dem der Zufallsvektor Wurde definiert. Aus der obigen Tabelle der gemeinsamen Verteilung können wir ersehen, dass die Wahrscheinlichkeitsverteilung des Gelenks der Wahrscheinlichkeitsverteilung der Marginals entspricht (die "fast sichere" Qualifikation aufgrund des Vorhandenseins von zwei Ereignissen der Maßnahme Null). Auch hier konditionieren wir also im Wesentlichen die Wahrscheinlichkeiten für für den gesamten Probenraum. Daraus folgt, dass unsere Aktion zum Öffnen der Hülle auch die Wahrscheinlichkeitsstruktur für nicht beeinflusst hat .{A{x,2x}}(A,B)BB

Geben Sie neben der Entscheidungsfindung auch die Spieltheorie ein. Wir haben den Umschlag geöffnet und müssen uns entscheiden, ob wir wechseln oder nicht. Wenn wir nicht wechseln, erhalten wir das Dienstprogramm . Wenn wir wechseln, befinden wir uns in den folgenden zwei möglichen Zuständen der Weltu(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Wir wissen nicht, welcher Zustand tatsächlich gilt, aber gemäß der obigen Diskussion wissen wir, dass jeder eine Wahrscheinlichkeit von . p=0.5

Wir können dies als ein Spiel modellieren, bei dem unser Gegner "Natur" ist und bei dem wir wissen, dass die Natur mit Sicherheit eine zufällige Strategie spielt : mit und mit , . Aber wir wissen jetzt auch, dass unsere Auszahlung sicher ist, wenn wir nicht wechseln. Hier ist also unser Spiel in normaler Form mit unseren Auszahlungen:p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Wir sollten die Versuchung widerstehen zu substituieren und für . ist eine bekannte und bestimmte Auszahlung. Die Auszahlungen für die "Switch" -Strategie sind eigentlich nicht bekannt (da wir den Wert von nicht kennen ). Also sollten wir die Substitution umkehren . Wenn dann ist , und wenn dann ist . Also hier ist wieder unser Spiel:u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Jetzt sind alle Auszahlungen in der Matrix bekannt. Gibt es eine rein dominante Strategie?

Die erwartete Auszahlung der Strategie "Switch" ist

E(VS)=0.5u(2y)+0.5u(y/2)

Die erwartete Auszahlung der Strategie "Don't Switch" ist

E(VDS)=u(y)

Wir sollten wechseln, wenn

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

Und jetzt wird die Einstellung zum Risiko kritisch. Es ist nicht schwer abzuleiten, dass wir bei Risikobereitschaft und risikoneutralem Verhalten wechseln sollten.

In Bezug auf risikoaverses Verhalten finde ich ein elegantes Ergebnis:

Für "weniger konkave" (genau oben) Dienstprogrammfunktionen als logarithmische (z. B. Quadratwurzel) sollten wir trotzdem wechseln.

Für das logarithmische Dienstprogramm ist es gleichgültig, ob umgeschaltet wird oder nicht.u(y)=lny

Für "konkavere" als (streng unten) logarithmische Dienstprogrammfunktionen sollten wir nicht wechseln.

Ich schließe mit dem Diagramm des logarithmischen Falls

Geben Sie hier die Bildbeschreibung ein

Angenommen, . Dann ist . Die Linie ist die Linie, auf der der erwartete Nutzen von "Switch" liegen wird. Da die Natur eine Strategie spielt, befindet sie sich tatsächlich am Punkt , dem Mittelpunkt von . An diesem Punkt mit dem logarithmischen Dienstprogramm erhalten wir genau das gleiche Dienstprogramm von "Don't Switch", dh für dieses numerische Beispiel.y=4y/2=2,2y=8ΓΔΕΔ Γ - Δ - Ε ln ( 4 )5050ΔΓΔΕln(4)

Alecos Papadopoulos
quelle
Das Aufrufen der "Risikoaversion" über eine logarithmische Dienstprogrammfunktion löst das Paradoxon nicht auf. Wie von @HRSE unter Verwendung des Bayes-Theorems festgestellt, betragen die Wahrscheinlichkeiten, dass die Auszahlungen und sind, nicht 0,5, nachdem der Betrag im ersten Umschlag gesehen wurde. Dies würde nur für eine höchst fragwürdige Uniform gelten, die zuvor nicht korrekt war (für ). Wenn Sie einen richtigen Prior für (der die eigenen Überzeugungen über widerspiegelt ), besteht die Lösung darin, zu wechseln, wenn ausreichend klein ist, und den ersten Umschlag beizubehalten, wenn ausreichend groß ist. Siehe jstor.org/ stable / 2685310 .u(2y)u(y/2xx>0xxyy
Jarle Tufto
@JarleTufto So wie ich das sehe, ist der einheitliche Prior der richtige Prior, wenn man den Organisatoren des Spiels glaubt, wenn sie sagen, dass die Geldbeträge nach einem Bernoulli-Unentschieden mit in die Umschläge gesteckt wurden . Wenn man misstrauisch sein will, den Organisatoren nicht glauben und sich eine andere vorherige Überzeugung bilden will, ist es natürlich sein Recht, aber er müsste mit einem Argument kommen, um mich davon zu überzeugen, a) warum die Organisatoren lügen und b) wie wählt er den anderen Prior, den er wählt. Beachten Sie, dass meine Antwort voraussetzt, dass wir den Organisatoren in dieser Angelegenheit glauben. p=0.5
Alecos Papadopoulos
Ich stimme natürlich zu, dass Sie jeden Umschlag mit den Beträgen und mit gleichen Wahrscheinlichkeiten von 1/2 erhalten. Ich sage, dass die implizite unpassende Uniform vor , die Sie verwenden, , für alle zum Paradoxon führt, weil der Bayes-Satz dann zu wobei der beobachtete Betrag in der ersten Hüllkurve ist. Wenn stattdessen ein korrekter Prior verwendet wird, unterscheiden sich diese bedingten Wahrscheinlichkeiten und die optimale Entscheidung hängt von (und natürlich der Nutzfunktion) ab. X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto
@JarleTufto Dieses unzulässige, was Sie zuvor erwähnt haben, spiegelt Wahrscheinlichkeiten wider, die sich auf was beziehen?
Alecos Papadopoulos
Der Geldbetrag in den beiden Umschlägen beträgt und . Die vorherige Wahrscheinlichkeitsverteilung repräsentiert Ihre Überzeugungen über ungefähr bevor Sie einen Umschlag öffnen. Sie verwenden diesen bestimmten Prior entweder implizit oder begehen den Irrtum, umgekehrte bedingte Wahrscheinlichkeiten gleichzusetzen. 2 X X.X2XX
Jarle Tufto
0

Wenn Sie den Umschlag E1 öffnen und feststellen , dass sein Wert E1 = Y ist , ist der Wert des anderen Umschlags E2 in {E2 = Y / 2, E2 = 2Y} .

Es ist auch wahr, dass der erwartete Wert dieser Hüllkurve (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) ist .

Der Fehler geht davon aus, dass Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 ist, unabhängig davon, was Y ist. Eine vereinfachte Möglichkeit, dies zu zeigen, besteht darin, anzunehmen, dass jeder Umschlag US-Papiergeld verschiedener Stückelungen enthält. Wenn Y 1 $ = , dann ist es unmöglich , E2 zu sein Y / 2 .

Ein strenger Beweis ist zu detailliert hier zu schaffen, sondern eine Zusammenfassung davon ist es , zunächst davon ausgehen , dass für jeden Wert Z , daß Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Dies ist im Wesentlichen die gleiche Annahme wie im letzten Absatz, erweitert auf einen Wertebereich. Wenn dies jedoch für einen Wert von Z gilt , bedeutet dies, dass Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) für jeden Wert von N von -inf bis konstant ist inf. Da dies unmöglich ist, kann die Annahme nicht richtig sein.

+++++

Das mag etwas verwirrend gewesen sein, also lassen Sie mich ein Beispiel versuchen. Sie erhalten zwei Sätze mit zwei Umschlägen. In einem Satz enthalten sie 10 und 20 Dollar. In der anderen enthalten sie 20 und 40. Sie wählen einen Satz aus und öffnen dann einen Umschlag in diesem Satz, um 20 zu finden. Sie haben dann die Möglichkeit, zum anderen Umschlag in diesem Satz zu wechseln. Solltest du?

Ja, sollte wechseln. Die erwartete Verstärkung durch Umschalten auf die andere Hüllkurve beträgt [(20-10) + (20-40)] / 2 = +5.

Beachten Sie, dass diese Instanz - das heißt, wenn Sie wissen, dass Sie 20 und nicht 10 oder 40 gefunden haben - den Bedingungen entspricht, die Sie in Ihrer Frage beschreiben. Ihre Lösung funktioniert also. Das Experiment selbst passt jedoch nicht zu dieser Beschreibung. Wenn Sie 10 oder 40 gefunden haben, beträgt die Wahrscheinlichkeit, dass ein anderer Umschlag 20 hat, 100%. Die erwarteten Gewinne betragen +10 bzw. -20. Und wenn Sie die drei möglichen Gewinne über die Wahrscheinlichkeiten mitteln, erhalten Sie die drei Werte, erhalten Sie 10/4 + 5/2 - 20/4 = 0.

JeffJo
quelle
Warum sollte ich annehmen, dass ein Umschlag keine 50 Cent enthalten kann? Die Frage bezieht sich auch speziell auf Zeiten, in denen Sie die möglichen Beträge, die darin enthalten sein könnten, nicht kennen, nur die möglichen relativen Beträge, also verfolge ich dies nicht wirklich.
Kitsune Kavallerie
Ich sagte, es sei ein simpler Ansatz. Es begann mit der Annahme, dass jeder Umschlag US-Papiergeld enthält. Da Sie keine 50 Cent in US-Papiergeld haben können, ist Pr (E2 = 1) = 1. Der Punkt ist, dass die Annahme, dass Y / 2 und 2Y gleich wahrscheinlich sind, wenn Sie Y nicht kennen, eine De-facto-Verteilung für Y voraussetzt, die unmöglich zu erreichen ist. 2|E1=
JeffJo
0

Im Allgemeinen ist das Problem nicht lösbar, da Sie das Randomisierungsverfahren des gesamten Experiments nicht angegeben haben.

Aber sei Y der Wert des Umschlags, den du ausgewählt hast, und X der andere Umschlag. Die Antwort lautet dann - was eine bedingte Erwartung ist . Unter der Annahme einer allgemeinsten Verteilung von Y wird Y jedoch einheitlich aus allen . Aber dann ist , und nach dem Borel-Kolmogorov- Paradoxon ist die Erwartung unlösbar.E[X|Y=y]R P r ( Y = y ) = 0RPr(Y=y)=0

John Rambo
quelle
@ JeffJo, ich konnte unter Ihrem Beitrag keinen Kommentar abgeben, da ich keinen ausreichenden Ruf habe. Ich habe diese Antwort hinzugefügt, weil ich glaube, dass sie mit Ihrem Beitrag zusammenhängt.
John Rambo