Osborne, Nash Gleichgewichte und die Richtigkeit der Überzeugungen

12

In Osbornes Eine Einführung in die Spieltheorie Das Nash-Gleichgewicht wird wie folgt beschrieben (S. 21–22):

Zunächst wählt jeder Spieler seine Aktion nach dem Modell von rationale Wahl, angesichts ihrer Überzeugung über die Aktionen der anderen Spieler. Zweitens ist der Glaube jedes Spielers an die Aktionen der anderen Spieler richtig.

Es scheint mir, dass diese Definition nicht vollständig der üblichen Definition des Nash-Gleichgewichts als Strategieprofil entspricht, bei dem die Strategie eines jeden Spielers die beste Antwort auf die Strategien des anderen ist.

Die übliche Definition sagt nichts über Überzeugungen aus und lässt daher die Möglichkeit zu, dass Überzeugungen falsch sein könnten.

Um eine triviale Möglichkeit zu ergreifen, betrachten Sie das Gefangenendilemma. Angenommen, jeder Spieler glaubt, dass der andere Spieler nicht gestehen wird. Da das Gestehen eine vorherrschende Strategie ist, würde jeder Spieler immer noch gestehen. Die Aktionen stellen also ein Nash-Gleichgewicht dar, obwohl die Überzeugungen der Spieler den tatsächlichen Gleichgewichtsaktionen völlig entgegengesetzt sind.

Habe ich in diesem Verständnis recht, dass Osbornes Definition etwas anderes als Nashs Gleichgewicht kennzeichnet?

game-theory Jyotirmoy Bhattacharya
quelle

Nicht "Die übliche Definition sagt nichts über Überzeugungen aus und lässt daher die Möglichkeit zu, dass Überzeugungen falsch sind." Einfach davon abhängen, dass Sie in diesen Definitionen immer eine zugrunde liegende Rationalitätsannahme haben?

Thorst

9

Die Sprache der Glaubenssätze hier einzuführen, ist etwas seltsam, da Glaubenssätze in anderen Teilen der Spieltheorie eine sehr spezifische Bedeutung haben.

In der Tat erinnert Osbornes Beschreibung an ein Bayes-Nash-Gleichgewicht. Wir könnten den Begriff des Glaubens folgendermaßen in die normale Form eines vollständigen Informationsspiels einführen: Nehmen wir an, dass mit einer Wahrscheinlichkeit von $ a_i $ jeder Spieler, $ i $, ein "strategischer" ist. Art Wer nach (Nash) -Gleichgewicht spielt und mit einer Wahrscheinlichkeit von $ 1-a_i $ eine Strategie einheitlich zufällig auswählt (weil er beispielsweise über alle Aktionen hinweg gleichgültig ist). Wir haben also ein Bayes'sches Spiel, in dem es natürlicher ist, über Überzeugungen nachzudenken.

Das Lösungskonzept von Bayes Nash besagt dann, dass die Strategie von $ i $ angesichts des erwarteten Spiels, das durch die Strategien der anderen Spieler hervorgerufen wird, optimal sein muss und die Überzeugungen über ihre Typen, die $ \ {a_j \} _ {j \ neq i} $ impliziert. Betrachten wir das Limit als $ a_i \ rightarrow 1 $ for all $ i $, so stimmt das Bayes Nash-Gleichgewicht dieses Spiels mit dem von Osborne beschriebenen Lösungskonzept überein.

Ich denke, der Grund, warum Osborne es so schrieb, ist pädagogisch, da es sich um einen Einführungstext handelt. Wenn wir den Schülern statische Spiele vorstellen, sagen wir ihnen, dass Spieler $ i $ am besten auf die Aktionen der anderen Spieler reagiert. Die Schüler möchten natürlich wissen, "wie sie auf eine gleichzeitig gewählte Strategie reagieren können, ohne zu wissen, wie diese Strategie aussehen wird." Dies ist in vielerlei Hinsicht eine philosophische Frage. Häufige Antworten sind

Wenn das Spiel oft gespielt wird, werden die Probleme von andere Ergebnisse, die in wiederholten Spielen aufrechterhalten werden können, können wir denken von Nash als ein Gleichgewicht in dem Sinne, dass, wenn wir zusammenlaufen dort können wir eine norm entwickeln, in der die menschen das weiterhin spielen Gleichgewicht auf unbestimmte Zeit (und erwarten, dass andere dasselbe tun).
Wenn es sich bei dem Spiel wirklich um ein Einzelspiel handelt, gehen wir normalerweise davon aus, dass die Spieler versuchen werden, vorherzusagen, was andere tun werden - und unser Gleichgewichtsbegriff enthält die Idee, dass diese Vorhersagen korrekt sein müssen.

Es scheint, dass die Vorhersagen im zweiten Punkt den von Osborne angeführten "Überzeugungen" entsprechen. Es ist jedoch wichtig zu betonen, dass diese Vorhersagen / "Überzeugungen" lediglich ein informelles / intuitives Werkzeug sind, um uns bei der Konzeption der Vorgänge in einem Gleichgewicht zu helfen, und nicht Teil der Definition eines solchen Gleichgewichts sind. Das Konzept des Nash-Gleichgewichts selbst ist in Bezug auf den Begriff des Glaubens völlig agnostisch (wie Sie in einem Kommentar bemerken, wird es nur über Handlungen definiert), weshalb, wenn Osborne fortfährt formal Wenn er das Nash-Gleichgewicht definiert, tut er dies, ohne sich überhaupt auf die Idee des Glaubens zu berufen.

Ubiquitous
quelle

4

Durch die Einführung des Glaubens wird das Konzept von NE mit anderen Verfeinerungskonzepten wie PBE und sequentiellem Gleichgewicht vergleichbar, die Bedeutung von NE wird jedoch nicht geändert.

Das Diplom-Mikrobuch von Mas-Colell, Whinston und Green (MWG) hat ein Ergebnis dafür

Proposition 9.C.1. Ein Strategieprofil $ \ sigma $ ist genau dann ein Nash-Gleichgewicht eines umfangreichen Formspiels $ \ Gamma_E $, wenn es existiert existiert ein System von Überzeugungen $ \ mu $, so dass

Das Strategieprofil $ \ sigma $ ist bei gegebenem Glaubenssystem $ \ mu $ sequentiell rational bei allen Informationen setzt $ H $ so, dass $ \ Pr (H | \ sigma) & gt; 0 $ .

Das Glaubenssystem $ \ mu $ wird, wann immer möglich, aus dem Strategieprofil $ \ sigma $ durch Bayes 'Regel abgeleitet.

Das Beispiel Gefangenendilemma, das Sie geben, wo Spieler Überzeugungen haben, die der tatsächlichen Strategie des Gegners entgegengesetzt sind, besteht in der zweiten Bedingung nicht, wonach Überzeugungen nach Möglichkeit aus der Bayes-Regel abgeleitet werden müssen. Tatsächlich ist dies das mathematische Äquivalent der zweiten Anforderung von Osbornes Definition: dass der Glaube eines Spielers an die Handlungen der anderen Spieler korrekt ist.

Herr K.
quelle

Ich denke, es gibt einen Unterschied zwischen MWG und Osborne. MWG sagen, dass für ein Nash-Gleichgewicht ein System von Überzeugungen existiert, das es sinnvoll macht. Wir schweigen darüber, welche Überzeugungen die Spieler tatsächlich haben. Osborne sagt, dass die Spieler tatsächlich Überzeugungen haben und sie die richtigen sind. Ich dachte, dass letztere die begriffliche Bedeutung von NE ändert, da in der üblichen Definition Überzeugungen überhaupt nicht erwähnt werden und das Beispiel des Gefangenen-Dilemmas zeigt, dass die Strategien die Überzeugungen nicht eindeutig bestimmen.

Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya: Ich glaube nicht, dass MWG "darüber schweigt, welche Überzeugungen die Spieler tatsächlich haben, wenn überhaupt". Bedingung 2 des Satzes erfordert tatsächlich, dass dieser Glaube nach Möglichkeit aus dem Gleichgewichtsstrategieprofil unter Verwendung der Bayes-Regel abgeleitet wird. Wenn also in dem PD-Beispiel ein Spieler einen Fehler mit der Wahrscheinlichkeit 1 auswählt, muss der Glaube des anderen Spielers auch die Wahrscheinlichkeit 1 auf den Aktionsfehler setzen und bei einer solchen Annahme am besten reagieren (was dazu führt, dass er auch einen Fehler auswählt).

Herr K.

@JyotirmoyBhattacharya: Der Glaube an NE muss jedoch nicht eindeutig sein. Dies liegt daran, dass, wenn für ein gegebenes Gleichgewicht ein Pfad in einem Spielbaum mit einer Wahrscheinlichkeit von Null genommen wird, die Bayes-Regel nicht gilt, und daher jede Annahme in Bezug auf diesen Pfad in einem NE als "korrekt" angesehen wird. Dies ist auch der Grund, warum Verfeinerungen wie das sequentielle Gleichgewicht eingeführt werden, um unvernünftige Annahmen außerhalb der Gleichgewichtspfade auszuschließen.

Herr K.

@JyotirmoyBhattacharya: Da es sich um ein Lehrbuch für Studenten handelt, hat Osborne aus pädagogischen Gründen möglicherweise eine Sprache gewählt, die intuitiver als mathematisch streng ist. Für mich sind die beiden Bedingungen in Osbornes Definition genaue Entsprechungen in MWGs Proposition.

Herr K.

3

Das Dilemma Ihres Gefangenen funktioniert nur, weil dies ein Spiel mit dominanten Strategien ist. Osborne ist richtig.

Um am besten auf die Strategie eines anderen Spielers zu reagieren, wie in der von Ihnen angegebenen Definition, muss ich dessen Strategie kennen. Mit anderen Worten, ich muss Überzeugungen darüber haben, was sie tun, und diese Überzeugungen müssen richtig sein. Dies ist eine Stärkung des Konzepts der Rationalisierbarkeit.

Sie machen einen interessanten Punkt darüber, wie Sie in Spielen mit dominanten Strategien seltsame "Gleichgewichte" erzielen können. Dies entspricht dem Ergebnis $ (\ sigma, \ mu_1) $ und $ (\ sigma, \ mu_2) $, wobei $ \ mu_2 $ möglicherweise falsch ist und nicht rationalisierbare Strategien positiv gewichtet werden. Aber ich habe noch nie ein Nash-Gleichgewicht mit Überzeugungen gesehen. Die Definitionen, an die ich mich erinnere, lauten: "Ein Strategieprofil $ \ sigma \ in \ Sigma $ ist ein Nash-Gleichgewicht, wenn $ \ sigma_i \ in B_i (\ sigma _ {- i}) $ ..." Überzeugungen sind unnötig, da die Überzeugungen genau eine korrekte Einschätzung des Strategieprofils sind. Unter Bezugnahme auf eines meiner Bücher gibt es die übliche Definition mit einem Nash (1950) -Zitat und geht dann auf zwei zugrunde liegende Annahmen ein. Der eine ist der richtige Glaube und der andere ist das vernünftige Spiel angesichts dieser richtigen Überzeugungen.

Pburg
quelle

Aber um etwas zu widerlegen, genügt ein Gegenbeispiel. Wenn Sie von Osborne ausgehen, dass seine Definition der von Nash entspricht, wie geht man dann mit dem Gegenbeispiel des Gefangenen-Dilemmas um? Ich verstehe, dass Osbornes Definition eine Stärkung der Rationalisierbarkeit darstellt. Ich behaupte, dass es sich nicht um ein Nash-Gleichgewicht handelt, weil hier das Gleichgewicht über Handlungen und Überzeugungen definiert ist, während das Nash-Gleichgewicht über Überzeugungen völlig schweigt.

Jyotirmoy Bhattacharya

1

Es ist eine Definition, kein Beweis.

Pburg

Meinetwegen. Aber es ist eine Definition eines Begriffs, der bereits eine andere anerkannte Definition hat. Ich gehe also davon aus, dass der Autor, wenn er nichts anderes erwähnt, behauptet, dass die beiden Definitionen gleichwertig sind.

Jyotirmoy Bhattacharya

Bezieht er diese Kommentare in die Definition oder in die Diskussion ein? p.s. Ich habe meine Antwort bearbeitet

Pburg

Der Teil, den ich zitierte, ist Diskussion. Unmittelbar danach sagt er (S.22) "Diese beiden Komponenten sind in der folgenden Definition enthalten" und gibt dann die Standarddefinition in Bezug auf die beste Reaktion auf Strategien, bei denen Überzeugungen überhaupt nicht erwähnt werden. Wo also sind die Überzeugungen in der Definition verankert? Und das Problem liegt nicht nur in Spielen mit dominanten Strategien. Es ist durchaus möglich, Beispiele zu erstellen, bei denen es keine dominanten Strategien gibt, aber Nash-Gleichgewichtsstrategien die besten Antworten auf Überzeugungen sind, die sich vom Gleichgewichtsspiel unterscheiden.

Jyotirmoy Bhattacharya

2

Ich wiederhole vielleicht Dinge, die vorher gesagt wurden, aber hier ist meine Einstellung dazu.

Ich denke, wir stehen vor einem üblichen Problem, wenn wir zwei verschiedene Modelle vergleichen. Was eine "Äquivalenz" bedeutet, ist nicht ganz offensichtlich, da die beiden Definitionen in verschiedenen Welten oder verschiedenen Modellen liegen. Wenn jedoch "Äquivalenz" richtig definiert ist, kann man meiner Meinung nach die Definition von Osborne verstehen und zeigen, dass sie tatsächlich einem NE "äquivalent" ist.

Das dem zitierten Abschnitt zugrunde liegende Lösungskonzept sieht etwa so aus:

Glaubensgleichgewicht (BE): & gt; Ein Strategieprofil $ s ^ * $ und ein Glaubensprofil $ b ^ * $, in dem für alle Spieler $ i $

$$ u_i (s ^ * _i ~ | ~ s _ {- i} = b ^ * _ {i}) \ geq u_i (s '~ | ~ s _ {- i} = b ^ * _ {i}) \ text {für alle} s '\ in S_i $$ und $$ b ^ * _ i = s ^ * _ {- i} $$

Das Problem, wenn wir zu einer Äquivalenzaussage kommen wollen, ist, dass wir einerseits das BE haben, das in einer Welt mit ... Überzeugungen "lebt", und andererseits den NE-Begriff, der in einer Welt lebt ... frei von Überzeugungen. Was würde eine Äquivalenzaussage wie "NE $ \ Leftrightarrow $ BE" möglicherweise bedeuten?

1) BE $ \ Rightarrow $ NE

Diese Richtung der Implikation ist wahrscheinlich unumstritten, weil wir von einem komplexeren zu einem einfacheren Modell übergehen. "Jedes BE ist ein NE" sollte das bedeuten, wenn wir das Gleichgewicht betrachten Strategie Profil eines BE alleine (dh ohne sein unterstützendes Glaubensprofil $ p $), sollte es ein NE sein. Man kann überprüfen, ob dies der Fall ist.

2) NE $ \ Rightarrow $ BE

Dies ist der schwierige Teil. Was bedeutet es, dass "jeder NE ein BE ist"? Sicher nicht das "ein NE plus irgendein Das Glaubensprofil ist ein BE ", wie das OP mit seinem Gegenbeispiel zeigte. Dennoch ist es der Fall, dass" jeder NE ein BE werden kann für einige Glaubensprofil ". Ich denke, in diesem Sinne sollte man Osbornes" Äquivalenz "-Anspruch verstehen

Beachten Sie, dass wir auch die folgende "Äquivalenz-ähnliche" Aussage haben: "An Ergebnis des Spiels ist genau dann ein NE-Ergebnis, wenn es ein BE-Ergebnis ist ".

Martin Van der Linden
quelle

Aber jedes BE ist kein NE, da das BE-Konzept eine Schwächung der Rationalisierbarkeit darstellt, die wir strikt schwächer als NE sind.

Jyotirmoy Bhattacharya

Wie ich schrieb, habe ich Probleme zu verstehen, was es für ein BE bedeutet, kein NE zu sein, weil sie in verschiedenen Modellen zu leben scheinen. Meinst du, dass einige Strategien, die an einem BE gespielt werden, nicht NE sind? Ich dachte, das wäre falsch, aber ich hätte vielleicht etwas verpasst. Wenn du das meinst, könntest du mich dann auf ein Gegenbeispiel hinweisen? Das wäre sehr hilfreich.

Martin Van der Linden

Ich bin nicht sicher, ob BE eine Schwächung der Rationalisierbarkeit darstellt. Nach meinem Verständnis ist BE Rationalisierbarkeit zusammen mit der Bedingung, dass Vermutungen richtig sind, oder? Wenn das richtig ist, wären wir dann nicht stärker als Rationalisierbarkeit? (Es kann natürlich davon abhängen, was als "schwächeres / stärkeres" Lösungskonzept bezeichnet wird.)

Martin Van der Linden

Osborne, Nash Gleichgewichte und die Richtigkeit der Überzeugungen

Antworten: