In Osbornes Eine Einführung in die Spieltheorie Das Nash-Gleichgewicht wird wie folgt beschrieben (S. 21–22):
Zunächst wählt jeder Spieler seine Aktion nach dem Modell von rationale Wahl, angesichts ihrer Überzeugung über die Aktionen der anderen Spieler. Zweitens ist der Glaube jedes Spielers an die Aktionen der anderen Spieler richtig.
Es scheint mir, dass diese Definition nicht vollständig der üblichen Definition des Nash-Gleichgewichts als Strategieprofil entspricht, bei dem die Strategie eines jeden Spielers die beste Antwort auf die Strategien des anderen ist.
Die übliche Definition sagt nichts über Überzeugungen aus und lässt daher die Möglichkeit zu, dass Überzeugungen falsch sein könnten.
Um eine triviale Möglichkeit zu ergreifen, betrachten Sie das Gefangenendilemma. Angenommen, jeder Spieler glaubt, dass der andere Spieler nicht gestehen wird. Da das Gestehen eine vorherrschende Strategie ist, würde jeder Spieler immer noch gestehen. Die Aktionen stellen also ein Nash-Gleichgewicht dar, obwohl die Überzeugungen der Spieler den tatsächlichen Gleichgewichtsaktionen völlig entgegengesetzt sind.
Habe ich in diesem Verständnis recht, dass Osbornes Definition etwas anderes als Nashs Gleichgewicht kennzeichnet?
quelle
Antworten:
Die Sprache der Glaubenssätze hier einzuführen, ist etwas seltsam, da Glaubenssätze in anderen Teilen der Spieltheorie eine sehr spezifische Bedeutung haben.
In der Tat erinnert Osbornes Beschreibung an ein Bayes-Nash-Gleichgewicht. Wir könnten den Begriff des Glaubens folgendermaßen in die normale Form eines vollständigen Informationsspiels einführen: Nehmen wir an, dass mit einer Wahrscheinlichkeit von $ a_i $ jeder Spieler, $ i $, ein "strategischer" ist. Art Wer nach (Nash) -Gleichgewicht spielt und mit einer Wahrscheinlichkeit von $ 1-a_i $ eine Strategie einheitlich zufällig auswählt (weil er beispielsweise über alle Aktionen hinweg gleichgültig ist). Wir haben also ein Bayes'sches Spiel, in dem es natürlicher ist, über Überzeugungen nachzudenken.
Das Lösungskonzept von Bayes Nash besagt dann, dass die Strategie von $ i $ angesichts des erwarteten Spiels, das durch die Strategien der anderen Spieler hervorgerufen wird, optimal sein muss und die Überzeugungen über ihre Typen, die $ \ {a_j \} _ {j \ neq i} $ impliziert. Betrachten wir das Limit als $ a_i \ rightarrow 1 $ for all $ i $, so stimmt das Bayes Nash-Gleichgewicht dieses Spiels mit dem von Osborne beschriebenen Lösungskonzept überein.
Ich denke, der Grund, warum Osborne es so schrieb, ist pädagogisch, da es sich um einen Einführungstext handelt. Wenn wir den Schülern statische Spiele vorstellen, sagen wir ihnen, dass Spieler $ i $ am besten auf die Aktionen der anderen Spieler reagiert. Die Schüler möchten natürlich wissen, "wie sie auf eine gleichzeitig gewählte Strategie reagieren können, ohne zu wissen, wie diese Strategie aussehen wird." Dies ist in vielerlei Hinsicht eine philosophische Frage. Häufige Antworten sind
Es scheint, dass die Vorhersagen im zweiten Punkt den von Osborne angeführten "Überzeugungen" entsprechen. Es ist jedoch wichtig zu betonen, dass diese Vorhersagen / "Überzeugungen" lediglich ein informelles / intuitives Werkzeug sind, um uns bei der Konzeption der Vorgänge in einem Gleichgewicht zu helfen, und nicht Teil der Definition eines solchen Gleichgewichts sind. Das Konzept des Nash-Gleichgewichts selbst ist in Bezug auf den Begriff des Glaubens völlig agnostisch (wie Sie in einem Kommentar bemerken, wird es nur über Handlungen definiert), weshalb, wenn Osborne fortfährt formal Wenn er das Nash-Gleichgewicht definiert, tut er dies, ohne sich überhaupt auf die Idee des Glaubens zu berufen.
quelle
Durch die Einführung des Glaubens wird das Konzept von NE mit anderen Verfeinerungskonzepten wie PBE und sequentiellem Gleichgewicht vergleichbar, die Bedeutung von NE wird jedoch nicht geändert.
Das Diplom-Mikrobuch von Mas-Colell, Whinston und Green (MWG) hat ein Ergebnis dafür
Das Beispiel Gefangenendilemma, das Sie geben, wo Spieler Überzeugungen haben, die der tatsächlichen Strategie des Gegners entgegengesetzt sind, besteht in der zweiten Bedingung nicht, wonach Überzeugungen nach Möglichkeit aus der Bayes-Regel abgeleitet werden müssen. Tatsächlich ist dies das mathematische Äquivalent der zweiten Anforderung von Osbornes Definition: dass der Glaube eines Spielers an die Handlungen der anderen Spieler korrekt ist.
quelle
Das Dilemma Ihres Gefangenen funktioniert nur, weil dies ein Spiel mit dominanten Strategien ist. Osborne ist richtig.
Um am besten auf die Strategie eines anderen Spielers zu reagieren, wie in der von Ihnen angegebenen Definition, muss ich dessen Strategie kennen. Mit anderen Worten, ich muss Überzeugungen darüber haben, was sie tun, und diese Überzeugungen müssen richtig sein. Dies ist eine Stärkung des Konzepts der Rationalisierbarkeit.
Sie machen einen interessanten Punkt darüber, wie Sie in Spielen mit dominanten Strategien seltsame "Gleichgewichte" erzielen können. Dies entspricht dem Ergebnis $ (\ sigma, \ mu_1) $ und $ (\ sigma, \ mu_2) $, wobei $ \ mu_2 $ möglicherweise falsch ist und nicht rationalisierbare Strategien positiv gewichtet werden. Aber ich habe noch nie ein Nash-Gleichgewicht mit Überzeugungen gesehen. Die Definitionen, an die ich mich erinnere, lauten: "Ein Strategieprofil $ \ sigma \ in \ Sigma $ ist ein Nash-Gleichgewicht, wenn $ \ sigma_i \ in B_i (\ sigma _ {- i}) $ ..." Überzeugungen sind unnötig, da die Überzeugungen genau eine korrekte Einschätzung des Strategieprofils sind. Unter Bezugnahme auf eines meiner Bücher gibt es die übliche Definition mit einem Nash (1950) -Zitat und geht dann auf zwei zugrunde liegende Annahmen ein. Der eine ist der richtige Glaube und der andere ist das vernünftige Spiel angesichts dieser richtigen Überzeugungen.
quelle
Ich wiederhole vielleicht Dinge, die vorher gesagt wurden, aber hier ist meine Einstellung dazu.
Ich denke, wir stehen vor einem üblichen Problem, wenn wir zwei verschiedene Modelle vergleichen. Was eine "Äquivalenz" bedeutet, ist nicht ganz offensichtlich, da die beiden Definitionen in verschiedenen Welten oder verschiedenen Modellen liegen. Wenn jedoch "Äquivalenz" richtig definiert ist, kann man meiner Meinung nach die Definition von Osborne verstehen und zeigen, dass sie tatsächlich einem NE "äquivalent" ist.
Das dem zitierten Abschnitt zugrunde liegende Lösungskonzept sieht etwa so aus:
Das Problem, wenn wir zu einer Äquivalenzaussage kommen wollen, ist, dass wir einerseits das BE haben, das in einer Welt mit ... Überzeugungen "lebt", und andererseits den NE-Begriff, der in einer Welt lebt ... frei von Überzeugungen. Was würde eine Äquivalenzaussage wie "NE $ \ Leftrightarrow $ BE" möglicherweise bedeuten?
1) BE $ \ Rightarrow $ NE
Diese Richtung der Implikation ist wahrscheinlich unumstritten, weil wir von einem komplexeren zu einem einfacheren Modell übergehen. "Jedes BE ist ein NE" sollte das bedeuten, wenn wir das Gleichgewicht betrachten Strategie Profil eines BE alleine (dh ohne sein unterstützendes Glaubensprofil $ p $), sollte es ein NE sein. Man kann überprüfen, ob dies der Fall ist.
2) NE $ \ Rightarrow $ BE
Dies ist der schwierige Teil. Was bedeutet es, dass "jeder NE ein BE ist"? Sicher nicht das "ein NE plus irgendein Das Glaubensprofil ist ein BE ", wie das OP mit seinem Gegenbeispiel zeigte. Dennoch ist es der Fall, dass" jeder NE ein BE werden kann für einige Glaubensprofil ". Ich denke, in diesem Sinne sollte man Osbornes" Äquivalenz "-Anspruch verstehen
Beachten Sie, dass wir auch die folgende "Äquivalenz-ähnliche" Aussage haben: "An Ergebnis des Spiels ist genau dann ein NE-Ergebnis, wenn es ein BE-Ergebnis ist ".
quelle