Schiedsrichter-Spiele mit nicht korrelierten halbprivaten Münzen

31

Die Antwort auf diese Frage interessierte mich (und interessiert mich immer noch) sehr, da dies eine interessante Variante der Komplexität von Spielen ist, die noch nicht gelöst wurde. Deshalb bot ich ein Kopfgeld an. Ich dachte, die ursprüngliche Frage sei sehr wahrscheinlich zu schwer, also habe ich drei verwandte Fragen gestellt, die ebenfalls der Prämie würdig wären. Niemand hat Antworten gepostet, bevor das Kopfgeld abgelaufen ist. Später konnte ich zwei der verwandten Fragen beantworten (Fragen 3 und 4, die unter meinem ursprünglichen Beitrag besprochen wurden). Dies zeigte, dass die Annäherung des Werts von Schiedsrichter-Spielen mit korrelierten halbprivaten Münzen (unten definiert) EXPTIME-vollständig war. Die ursprüngliche Frage ist noch unbeantwortet. Ich wäre auch an Ergebnissen interessiert, die ähnliche Spiele zwischen PSPACE und EXPTIME in interessante Komplexitätsklassen bringen.

ORIGINAL POST:

Diese Frage wurde von der Diskussion über Itais Hex-Frage inspiriert . Ein Schiedsrichterspiel ist ein Spiel, bei dem zwei rechnerisch unbegrenzte Spieler miteinander kommunizieren, indem sie einen Polynom-Zeit-Prüfer verwenden, der private Münzen werfen kann (daher ist die Anzahl der Runden und der Umfang der Kommunikation auch polynom-Zeit-begrenzt). Am Ende des Spiels führt der Schiedsrichter einen Algorithmus in P aus, um zu bestimmen, wer gewinnt. Die Entscheidung, wer ein solches Spiel gewinnt (auch ungefähr), ist EXPTIME abgeschlossen. Wenn Sie öffentliche Münzen und öffentliche Kommunikation haben, sind solche Spiele in PSPACE. ( Siehe Feige und Killian, "Making Games Short". ) Meine Frage betrifft die Grenze zwischen diesen beiden Ergebnissen.

  • Frage: Angenommen, Sie haben zwei rechnerisch unbegrenzte Spieler, die ein Spiel in Polynomlänge spielen. Die Rolle des Schiedsrichters ist darauf beschränkt, jedem Spieler vor jedem Zug einige private Münzwürfe zu ermöglichen (die nicht mit denen des anderen Spielers korrelieren). Alle Züge des Spielers sind öffentlich und werden von seinem Gegner gesehen - die einzige private Information sind die Münzwürfe. Am Ende des Spiels werden alle privaten Münzwürfe aufgedeckt, und der Mehrfachschiedsrichter verwendet diese Münzwürfe und die Züge des Spielers, um zu entscheiden, wer gewinnt.

    Nach dem Ergebnis der Schiedsrichter-Spiele liegt die ungefähre Wahrscheinlichkeit, dass der erste Spieler gewinnt, bei EXPTIME, und es ist auch eindeutig PSPACE-schwer. Welches ist es? Ist etwas über dieses Problem bekannt?

Beachten Sie, dass die Spieler möglicherweise gemischte Strategien anwenden müssen, da Sie auf diese Weise Nullsummen-Matrixspiele (a la von Neumann) spielen können.

ZUSATZMATERIAL:

Nennen wir diese Komplexität Klasse RGUSP (alle Sprachen , die zu einem referierten Spiel mit Unkorrelierte Semi Münzen reduziert werden kann , wie oben beschrieben, so dass , wenn x L , Spieler 1 gewinnt mit Wahrscheinlichkeit 2 / 3 , und wenn x L , Spieler 1 gewinnt mit einer Wahrscheinlichkeit von 1 / 3 ). Meine drei verwandten Fragen sind:LxL2/3xL1/3

  • Frage 2: RGUSP scheint ziemlich robust zu sein. Wenn wir beispielsweise das Spiel so ändern, dass der Schiedsrichter keine Nachrichten sendet, sondern nur die öffentlichen Nachrichten von Spieler 1 und 2 beachtet und private Nachrichten von ihnen empfängt, entspricht die Annäherung des Werts dieses Spiels immer noch RGUSP. Ich möchte demonstrieren, dass RGUSP robust ist, also bin ich bereit, jedem, der eine natürliche Komplexitätsklasse C vorfindet, das Kopfgeld zu geben, so dass PSPACE C RGUSP, wo keiner der Containments genau zu sein scheint.

  • Frage 3: Ich habe auch den starken Verdacht, dass die Klasse RGCSP (Referierte Spiele mit korrelierten halbpriven Münzen) EXPTIME vollständig ist, und ich bin auch bereit, jemandem, der diese Tatsache beweist, das Kopfgeld zu geben. In RGCSP gibt der Schiedsrichter im ersten Schritt den beiden Spielern korrelierte Zufallsvariablen (zum Beispiel kann er dem ersten Spieler einen Punkt in einer großen Projektionsebene geben und dem zweiten Spieler eine Linie, die diesen Punkt enthält). Danach senden die beiden Spieler für eine polynomielle Anzahl von Runden abwechselnd öffentliche Nachrichten in Polygröße. Nach dem Spiel entscheidet der Mehrfachschiedsrichter, wer gewonnen hat. Wie komplex ist es, die Gewinnwahrscheinlichkeit für Spieler 1 zu approximieren?

  • Frage 4: Schließlich habe ich noch eine Frage, die sich wirklich mit Kryptographie und Wahrscheinlichkeitsverteilungen befassen könnte: Wenn zwei Spieler in einem Schiedsrichterspiel mit nicht korrelierten halbprivaten Münzen eine vergessene Übertragung ausführen können, können sie ein beliebiges Schiedsrichterspiel mit korrelierten Münzen spielen (oder lässt es sie alternativ ein Spiel spielen, um zu bestimmen, welcher Gewinner EXPTIME-complete ist)?

Peter Shor
quelle
3
Eine Beobachtung ist, dass der Schiedsrichter den Spielern nur zu Beginn des Spiels zufällige Münzen geben muss. Sie können für Spieler 1 kurz vor seinem Wechsel Zufall Münzen erzeugen , indem sie einen Teil seiner privaten Zufall Münzen nehmen vom Anfang des Spiels und XOR - Verknüpfen sie mit einem String s von Spielern geliefert 2. Es ist einfach , diese Spieler zu zeigen , 2 nicht tun Besser, als s zufällig zu wählen (in diesem Fall ist s XOR r auch zufällig). rsssr
Peter Shor
3
Ich hasse den Satz "halb privat, halb öffentlich". Wie wäre es mit halbprivaten?
Peter Shor
16
Nenne es 'Facebook privat';). Sie denken, es ist privat, aber es ist nicht
Suresh Venkat
3
Es scheint mir, dass der Feige-Kilian-Beweis nicht einfach angepasst werden kann, um diese Frage zu beantworten.
Peter Shor
2
Ich denke, Magic: The Gathering (und wahrscheinlich auch andere Sammelkartenspiele) sind perfekte Beispiele für diese schwächere Art von Schiedsrichterspiel. Ich spiele keine Magie, aber jeder Spieler hat ein Deck, und die Spieler mischen zunächst ihr eigenes Deck, sodass die Zufälligkeit nicht korreliert.
Peter Shor

Antworten:

12

Ich kann meine ursprüngliche Frage nicht beantworten, aber ich kann die Frage 3 (und 4) beantworten, die ich hinzugefügt habe, als ich ein Kopfgeld angeboten habe, weil ich dachte, dass die ursprüngliche Frage wahrscheinlich zu schwer war. Tatsächlich habe ich zwei Beweise für Frage 3.

Hier ist die Einstellung für Frage 3: Wir haben einen Polynom-Zeit-Schiedsrichter, der zu Beginn des Spiels den Spielern 1 und 2 korrelierte Zufallsvariablen gibt. Die Spieler 1 und 2 spielen dann das Spiel, ohne dass der Schiedsrichter eingreift. Am Ende des Spiels überprüft der Schiedsrichter das Protokoll und entscheidet, wer gewinnt. Ich kann zeigen , dass die Entscheidung , wer ein solches Spiel gewinnt , ist EXPTIME abgeschlossen ist , auch wenn Sie das Versprechen gegeben , dass die Sieger gewinnt mit einer Wahrscheinlichkeit von mindestens .2/3

======== Beweis 1 ============

Der erste Beweis basiert auf der Tatsache, dass eine unbewusste Übertragung für eine sichere Zwei-Parteien-Berechnung universell ist. Wenn die Spieler 1 und 2 einen vergesslichen Transfer ausführen können, können sie einen beliebigen Schiedsrichter in Polynomzeit simulieren, sodass die vorherigen Ergebnisse, dass die Schiedsrichter-Spiele EXPTIME complete sind, angewendet werden können.

Um nun zu Beginn des Spiels 1-2 vergessliche Transfers zu erzielen, gibt der Schiedsrichter den beiden Spielern eine große Anzahl von "vergesslichen Transferboxen". Wir beschreiben eines dieser vergesslichen Verteilergetriebe. P1 erhält zwei Zufallszahlen, und r 2 . P2 erhält eine dieser Zufallszahlen, wobei r i und die Variable i ( = 1 oder 2 ) angeben, welche der Zufallszahlen von P1 er erhalten hat. Um eine vergessliche Übertragung durchzuführen, nimmt P1 die beiden Daten, die er übertragen möchte, und XORs sie mit r 1 und r 2r1r2rii=12r1r2. P2 kann dann eine davon dekodieren, aber P1 kann nicht sagen, welche P2 dekodieren kann. Dies ist 1-2 vergessliche Übertragung. (Offensichtlich muss der Schiedsrichter den Spielern auch ahnungslose Transferboxen geben, die von P2 nach P1 gerichtet sind.)

Als ich zum ersten Mal Frage 4 stellte, war ich besorgt, dass die Ergebnisse der sicheren Zweiparteienberechnung für diese Art der interaktiven Berechnung mit einem Schiedsrichter nicht zutrafen, aber tatsächlich ist es recht einfach zu zeigen, dass dies der Fall ist.

=========== Beweis 2 ===========

2ntQt(,,)pQttQtQt+1

Das erste, was wir verwenden werden, ist, dass der Schiedsrichter auch bei nicht korrelierten Zufallsmünzen die Spieler 1 und 2 dazu bringen kann, ein Bit-Commitment durchzuführen, indem sie die Daten, die sie mit den Zufallsmünzen festschreiben möchten, XOR-verknüpft. So können wir über P1 und P2 sprechen, die Dinge in versiegelte Umschläge legen.

piipiiQt(pi)Qt(i)(pi,i)

(pi,i)

Qt(pi)Qt(pj)pkkzu P2's Liniensatz. Lassen Sie jede Dummy-Linie zwei Punkte haben. Wenn P1 zufällig den richtigen Wert für einen Dummy-Punkt auf einer Linie und den falschen Wert für den anderen Dummy-Punkt angibt, hat er sich als Lügner entlarvt, da P2 den Wert für eine gerade Linie nicht angeben kann korrigieren Sie einen der beiden Punkte von P1 und nicht den anderen. Wir können einen ähnlichen Trick machen, damit P2 konsequent antwortet. Dann bleibt nur noch zu zeigen, dass der letzte Schritt des Feige-Kilian-Beweises noch funktioniert. Dies stellt sich als unkompliziert heraus, obwohl das Durchgehen der Details diese Antwort viel länger machen würde.

Peter Shor
quelle