Es gibt zwei Umschläge. Einer enthält Geld und der andere enthält Geldbetrag. Die genaue Menge " " ist mir unbekannt, aber ich kenne die oben genannten. Ich nehme einen Umschlag und öffne ihn. Ich sehe Geld darin, offensichtlich wo .
Jetzt wird mir angeboten, Umschläge aufzubewahren oder zu wechseln.
Der erwartete Wert für das Umschalten ist . Der erwartete Wert für die Aufbewahrung meines Umschlags ist .
Es scheint, dass ich immer Umschläge wechseln sollte. Meine zwei Fragen:
Ist diese Argumentation richtig?
Ist es anders , wenn ich nicht erlaubt bin den Umschlag zu öffnen und die sieht Menge an Geld, und dann bin ich die Möglichkeit, auf unbestimmte Zeit zu wechseln?
microeconomics
expected-utility
Kitsune Kavallerie
quelle
quelle
Antworten:
Hier ist ein "erwarteter Nutzenmaximierungs- / spieltheoretischer" Ansatz für die Angelegenheit (mit einem Schuss satztheoretischer Wahrscheinlichkeit). In einem solchen Rahmen erscheinen die Antworten klar.
LOKAL
In absoluter Ehrlichkeit wird uns gesagt, dass für einen streng positiven Geldbetrag die folgenden zwei Tickets in eine Box gelegt wurden: mit der zugewiesenen Identifikationsnummer und mit zugewiesener Identifikationsnummer . Dann wurde eine Ziehung aus einer Bernoulli- Zufallsvariablen ausgeführt, und basierend auf dem Ergebnis und dem aufgetretenen Ereignis wurden die Beträge und in die Umschläge und . Uns wird nicht gesagt, was der Wert von ist oder welcher Betrag zu welchem Umschlag ging.{ A = x , B = 2 x } 1 { A = 2 x , B = x } 0 ( p = 0,5 ) x 2 x A B xx {A=x,B=2x} 1 {A=2x,B=x} 0 (p=0.5) x 2x A B x
Erster Fall: Wählen Sie einen Umschlag mit der Option, zu wechseln, ohne ihn zu öffnen
Die erste Frage ist, wie wir einen Umschlag auswählen . Dies hat mit Vorlieben zu tun. Nehmen wir also an , wir erwarten Utility-Maximierer mit der Utility-Funktion .u()
Wir können die probabilistische Struktur hier modellieren, indem wir zwei dichotome Zufallsvariablen betrachten, und die die Hüllkurven darstellen, und die Menge in ihnen. Die Unterstützung von jedem ist . Aber sie sind nicht unabhängig. Wir müssen also mit der gemeinsamen Verteilung beginnen. In Tabellenform sind die gemeinsame Verteilung und die entsprechenden RandverteilungenB { x , 2 x }A B {x,2x}
Dies sagt uns, dass und identische Randverteilungen haben.B.A B
Dies bedeutet jedoch, dass es keine Rolle spielt, wie wir Umschläge auswählen, da wir immer den gleichen erwarteten Nutzen erhalten .
Was wir hier sehen, ist ein zusammengesetztes Glücksspiel (wie man einen Umschlag auswählt) gegenüber zwei identischen Glücksspielen (jeder Umschlag). Wir können mit der Wahrscheinlichkeit , oder irgendetwas dazwischen wählen (und komplementär für ). Es spielt keine Rolle. Wir werden immer den gleichen erwarteten Nutzen erhalten. Beachten Sie, dass unsere Einstellung zum Risiko hier keine Rolle spielt.1 0 B.A 1 0 B
Also wählen wir einen Umschlag, sagen wir , und schauen ihn uns an. Was ist jetzt unser erwarteter Nutzen? Genau das gleiche wie vor der Auswahl . Das Auswählen eines Umschlags auf irgendeine Weise hat keinen Einfluss auf die Wahrscheinlichkeiten dessen, was sich darin befindet.A
Wir dürfen wechseln. Sagen wir es tun, und jetzt halten wir Umschlag . Was ist jetzt erwartet Nutzen? Genau das gleiche wie zuvor .B
Dies sind die beiden möglichen Zustände der Welt für uns: Wählen Sie oder wählen . Bei jeder Wahl implizieren beide Staaten der Welt den gleichen Wert für unsere gewählte / angenommene treibende Kraft (dh maximieren den erwarteten Nutzen).B.A B
Hier ist es uns also gleichgültig, zu wechseln. und in der Tat könnten wir auch randomisieren.
2. FALL: ÖFFNEN DES UMSCHLAGS mit der Option, danach zu wechseln
Angenommen, wir haben , geöffnet und innerhalb des Betrags . Ändert dies die Dinge? y ∈ { x , 2 x }A y∈{x,2x}
Wir werden sehen. Ich frage mich, was ist
Nun, ist der Probenraum, auf dem die Zufallsvariable definiert ist. Die Konditionierung des gesamten Probenraums, dh der trivialen Sigma-Algebra, beeinflusst weder die Wahrscheinlichkeiten noch die erwarteten Werte. Es ist, als ob wir uns fragen: "Was ist der Wert von wenn wir wissen, dass alle möglichen Werte realisiert wurden?" Es wurden keine effektiven Kenntnisse gewonnen, daher befinden wir uns immer noch in der ursprünglichen Wahrscheinlichkeitsstruktur.{x,2x} A A
Aber ich frage mich auch, was ist
Die Konditionierungsanweisung, die richtig als Sigma-Algebra betrachtet wird, die durch das Ereignis , ist der gesamte Produktprobenraum, auf dem der Zufallsvektor Wurde definiert. Aus der obigen Tabelle der gemeinsamen Verteilung können wir ersehen, dass die Wahrscheinlichkeitsverteilung des Gelenks der Wahrscheinlichkeitsverteilung der Marginals entspricht (die "fast sichere" Qualifikation aufgrund des Vorhandenseins von zwei Ereignissen der Maßnahme Null). Auch hier konditionieren wir also im Wesentlichen die Wahrscheinlichkeiten für für den gesamten Probenraum. Daraus folgt, dass unsere Aktion zum Öffnen der Hülle auch die Wahrscheinlichkeitsstruktur für nicht beeinflusst hat .{A∈{x,2x}} (A,B) B B
Geben Sie neben der Entscheidungsfindung auch die Spieltheorie ein. Wir haben den Umschlag geöffnet und müssen uns entscheiden, ob wir wechseln oder nicht. Wenn wir nicht wechseln, erhalten wir das Dienstprogramm . Wenn wir wechseln, befinden wir uns in den folgenden zwei möglichen Zuständen der Weltu(y)
Wir wissen nicht, welcher Zustand tatsächlich gilt, aber gemäß der obigen Diskussion wissen wir, dass jeder eine Wahrscheinlichkeit von .p=0.5
Wir können dies als ein Spiel modellieren, bei dem unser Gegner "Natur" ist und bei dem wir wissen, dass die Natur mit Sicherheit eine zufällige Strategie spielt : mit und mit , . Aber wir wissen jetzt auch, dass unsere Auszahlung sicher ist, wenn wir nicht wechseln. Hier ist also unser Spiel in normaler Form mit unseren Auszahlungen:p=0.5 y=x p=0.5 y=2x
Wir sollten die Versuchung widerstehen zu substituieren und für . ist eine bekannte und bestimmte Auszahlung. Die Auszahlungen für die "Switch" -Strategie sind eigentlich nicht bekannt (da wir den Wert von nicht kennen ). Also sollten wir die Substitution umkehren . Wenn dann ist , und wenn dann ist . Also hier ist wieder unser Spiel:u(x) u(2x) u(y) u(y) x y=x u(2x)=u(2y) y=2x u(x)=u(y/2)
Jetzt sind alle Auszahlungen in der Matrix bekannt. Gibt es eine rein dominante Strategie?
Die erwartete Auszahlung der Strategie "Switch" ist
Die erwartete Auszahlung der Strategie "Don't Switch" ist
Wir sollten wechseln, wenn
Und jetzt wird die Einstellung zum Risiko kritisch. Es ist nicht schwer abzuleiten, dass wir bei Risikobereitschaft und risikoneutralem Verhalten wechseln sollten.
In Bezug auf risikoaverses Verhalten finde ich ein elegantes Ergebnis:
Für "weniger konkave" (genau oben) Dienstprogrammfunktionen als logarithmische (z. B. Quadratwurzel) sollten wir trotzdem wechseln.
Für das logarithmische Dienstprogramm ist es gleichgültig, ob umgeschaltet wird oder nicht.u(y)=lny
Für "konkavere" als (streng unten) logarithmische Dienstprogrammfunktionen sollten wir nicht wechseln.
Ich schließe mit dem Diagramm des logarithmischen Falls
Angenommen, . Dann ist . Die Linie ist die Linie, auf der der erwartete Nutzen von "Switch" liegen wird. Da die Natur eine Strategie spielt, befindet sie sich tatsächlich am Punkt , dem Mittelpunkt von . An diesem Punkt mit dem logarithmischen Dienstprogramm erhalten wir genau das gleiche Dienstprogramm von "Don't Switch", dh für dieses numerische Beispiel.y=4 y/2=2,2y=8 Γ−Δ−E Δ Γ - Δ - Ε ln ( 4 )50−50 Δ Γ−Δ−E ln(4)
quelle
Wenn Sie den Umschlag E1 öffnen und feststellen , dass sein Wert E1 = Y ist , ist der Wert des anderen Umschlags E2 in {E2 = Y / 2, E2 = 2Y} .
Es ist auch wahr, dass der erwartete Wert dieser Hüllkurve (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) ist .
Der Fehler geht davon aus, dass Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 ist, unabhängig davon, was Y ist. Eine vereinfachte Möglichkeit, dies zu zeigen, besteht darin, anzunehmen, dass jeder Umschlag US-Papiergeld verschiedener Stückelungen enthält. Wenn Y 1 $ = , dann ist es unmöglich , E2 zu sein Y / 2 .
Ein strenger Beweis ist zu detailliert hier zu schaffen, sondern eine Zusammenfassung davon ist es , zunächst davon ausgehen , dass für jeden Wert Z , daß Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Dies ist im Wesentlichen die gleiche Annahme wie im letzten Absatz, erweitert auf einen Wertebereich. Wenn dies jedoch für einen Wert von Z gilt , bedeutet dies, dass Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) für jeden Wert von N von -inf bis konstant ist inf. Da dies unmöglich ist, kann die Annahme nicht richtig sein.
+++++
Das mag etwas verwirrend gewesen sein, also lassen Sie mich ein Beispiel versuchen. Sie erhalten zwei Sätze mit zwei Umschlägen. In einem Satz enthalten sie 10 und 20 Dollar. In der anderen enthalten sie 20 und 40. Sie wählen einen Satz aus und öffnen dann einen Umschlag in diesem Satz, um 20 zu finden. Sie haben dann die Möglichkeit, zum anderen Umschlag in diesem Satz zu wechseln. Solltest du?
Ja, sollte wechseln. Die erwartete Verstärkung durch Umschalten auf die andere Hüllkurve beträgt [(20-10) + (20-40)] / 2 = +5.
Beachten Sie, dass diese Instanz - das heißt, wenn Sie wissen, dass Sie 20 und nicht 10 oder 40 gefunden haben - den Bedingungen entspricht, die Sie in Ihrer Frage beschreiben. Ihre Lösung funktioniert also. Das Experiment selbst passt jedoch nicht zu dieser Beschreibung. Wenn Sie 10 oder 40 gefunden haben, beträgt die Wahrscheinlichkeit, dass ein anderer Umschlag 20 hat, 100%. Die erwarteten Gewinne betragen +10 bzw. -20. Und wenn Sie die drei möglichen Gewinne über die Wahrscheinlichkeiten mitteln, erhalten Sie die drei Werte, erhalten Sie 10/4 + 5/2 - 20/4 = 0.
quelle
Im Allgemeinen ist das Problem nicht lösbar, da Sie das Randomisierungsverfahren des gesamten Experiments nicht angegeben haben.
Aber sei Y der Wert des Umschlags, den du ausgewählt hast, und X der andere Umschlag. Die Antwort lautet dann - was eine bedingte Erwartung ist . Unter der Annahme einer allgemeinsten Verteilung von Y wird Y jedoch einheitlich aus allen . Aber dann ist , und nach dem Borel-Kolmogorov- Paradoxon ist die Erwartung unlösbar.E[X|Y=y] R P r ( Y = y ) = 0R Pr(Y=y)=0
quelle