Wann sollte ein Empfänger in einem Signalisierungsspiel zufällig Aktionen ausführen?

Angenommen , es ist ein Signalisierungsspiel mit einem endlichen Nachrichtenraum , endlichem Aktionsraum und endlichem Typ Raum . Noch einfacher ist, dass alle Absendertypen identische Einstellungen haben (der Empfänger bevorzugt nur unterschiedliche Aktionen als Reaktion auf unterschiedliche Typen). Kann der Empfänger jemals eine strengere Leistung erzielen, indem er die Antworten zufällig verteilt? Wenn ein Gleichgewicht besteht, in dem der Empfänger nur reine Maßnahmen ergreift? $M$ $A$ $T$

Ubiquitous fasste meine Frage gut zusammen: "Ist es jemals so, dass das Gleichgewicht mit den höchsten Empfängerauszahlungen notwendigerweise gemischte Strategien beinhaltet?"

Gehen wir zum sequentiellen Gleichgewicht. Wenn Sie zunächst eine Notation wünschen.

$\sigma_{t}(m)$ ist die Wahrscheinlichkeit, dass sendet . $t\in T$ $m\in M$

$\sigma_R^m(a)$ ist die Wahrscheinlichkeit, dass der Empfänger auf mit reagiert gibt die Überzeugungen des Empfängers nach Beobachtung von . $m$ $a\in A.$ $\mu^m \in \Delta T$ $m$

Ein sequentielles Gleichgewicht erfordert, dass optimale Antworten , bei optimal ist und bei Bayesian ist . Dies ist wirklich die Definition einer schwachen Sequenz, aber es gibt keinen Unterschied in einem Signalisierungsspiel. $\sigma_t$ $\sigma_R$ $\sigma_R$ $\mu$ $\mu$ $\sigma$

Meine Intuition sagt nein, wenn es ein Gleichgewicht gibt, in dem der Empfänger nur reine Aktionen spielt, aber ich war immer schrecklich mit solchen Sachen. Vielleicht müssen wir auch festlegen, dass es kein Nullsummenspiel ist, aber ich sage das nur, weil ich mich daran erinnere, dass Spieler mit der Fähigkeit, in diesen Spielen zufällig zu spielen, besser dran sind. Vielleicht ist das irgendwo eine Fußnote in einer Zeitung?

Betrachten Sie das folgende Spiel, bei dem die Absendereinstellungen nicht identisch sind. Ich entschuldige mich für die schlechte Qualität. Es gibt drei Absendertypen, die jeweils gleich wahrscheinlich sind. Wir können nur dann ein optimales Gleichgewicht für den Empfänger (Spieler 2) herstellen, wenn sie beim Empfang von Nachricht 1 zufällig sind. Dann spielen die Typen 1 und 3 und erzeugen ein trennendes Gleichgewicht. Wenn der Empfänger eine reine Strategie als Antwort auf , würde ein Typ 1 oder 2 abweichen und den Empfänger schlechter stellen. $m_2$ $m_1$

$\sigma_R^{m_1}(a)=.5=\sigma_R^{m_1}(r)=.5$

Geben Sie hier die Bildbeschreibung ein

game-theory Pburg
quelle

Haben die vom Empfänger in Abhängigkeit vom Typ ergriffenen Maßnahmen einen Einfluss auf die vom Absender gesendete Nachricht oder sind diese unabhängig?

Martin Van der Linden

Ich bin mir nicht ganz sicher, was du meinst. Es gibt einen Empfängertyp. Ihre Strategie ordnet Nachrichten einer Verteilung über Aktionen zu. Sie wirken sich nur insoweit auf die Nachricht aus, als die Absender die beste Antwort geben.

Pburg

Angenommen, es besteht ein Gleichgewicht, in dem der Empfänger über eine Reihe von Aktionen randomisiert . Dies bedeutet per Definition, dass er zwischen zwei beliebigen Wahrscheinlichkeitsverteilungen über gleichgültig sein muss - einschließlich derer, bei denen das gesamte Gewicht auf eine einzelne Aktion gelegt wird (reine Strategien). Nein, eine gemischte Strategie kann niemals streng besser sein als die beste reine Strategie. Oder habe ich die Frage falsch verstanden?

α

$\alpha$

α

$\alpha$

Allgegenwärtig

@ Ubiquitous Das macht für mich Sinn, aber ich habe mich gefragt, ob es einige seltsame pathologische Fälle geben könnte. Zum Beispiel konnte ich nur einen Satz finden: "Für generische Auswahlmöglichkeiten von Auszahlungen in einem Spiel mit endlicher umfangreicher Form und perfektem Rückruf sind die Auszahlungen für jede verbundene Komponente sequentieller Gleichgewichte konstant." Die generische Einschränkung ließ mich wundern.

Pburg

@Pburg Ja, ich verstehe. Es scheint, wir hatten verschiedene Fragen im Sinn. Ich dachte: "Ist es jemals so, dass die einzigartige beste Antwort des Empfängers auf eine bestimmte Senderstrategie eine gemischte Strategie ist?", Während Ihre Frage tatsächlich lautet: "Ist es jemals so, dass das Gleichgewicht mit den höchsten Empfängerauszahlungen notwendigerweise beinhaltet." gemischte Strategien? "

Allgegenwärtig

Antworten:

Vielleicht habe ich ein Gegenbeispiel!

$m_1, m_2,$ $m_3$ $t_1,t_2,t_3$ $\Pr(t=t_3)=\frac{1}{2}-\epsilon$ $\Pr(t=t_2)=\frac{1}{4}$ $\Pr(t=t_1)=\frac{1}{4}+\epsilon$ $m_3$ $0$

Der Satz von Empfängerantworten auf eine Nachricht ist $m=m_1,m_2$ $\{a,r\}$

$u_t(a,m_1)=1 > u_t(a,m_2)=\beta>u_t(r,\cdot)=0$

$u_R(t_1,m_1,a)=u_R(t_2,m_2,a)=2$ , , $u_R(t_3,m_i,a)=1$

$u_R(t_2,m_1,a)=u_R(t_2,m_1,a)=0$ , , $u_R(t_3,m_i,r)=2$

$u_R(t_1,m_i,r)=u_R(t_2,m_i,r)=1$ .

Dann müssen im Gleichgewicht alle Absender den gleichen Nutzen erhalten, richtig?. Andernfalls ahmt einer die Strategie des anderen nach.

Das einzige reine Strategiegleichgewicht besteht also darin, dass alle Absender wählen . In einem Pooling-Gleichgewicht auf oder ist die beste Antwort die Wahl von . Es gibt keine reine Strategie, die das Gleichgewicht trennt, außer wenn und senden und der Empfänger mit antwortet . Dann ist zwischen allen Nachrichten gleichgültig, da er mit Sicherheit mit wird . All dies gibt dem Empfänger eine Auszahlung $m_3$ $m_1$ $m_2$ $r$ $t_1$ $t_2$ $m_2$ $r$ $t_3$ $0$ $\frac{3}{2}-\epsilon$

Betrachten Sie dann den Fall, in dem undJetzt ist es den Absendern gleichgültig, ob sie diese beiden Nachrichten senden. Dann sei und für . Dann ist die Empfängerstrategie rational. $\sigma_R^{m_1}(a)=\beta$ $\sigma_R^{m_2}(a)=1.$ $\sigma_{t_3}(m_1)=\frac{\epsilon+1/4}{-\epsilon+1/2}=1-\sigma_{t_3}(m_1)$ $\sigma_{t_i}(m_i)=1$ $i=1,2$

Der erwartete Nutzen des Empfängers von bei oder beträgt 1,5. Der erwartete Nutzen aus leicht über 1,5, da . Die erwartete Ex-ante-Auszahlung liegt also über , besser als das oben beschriebene reine Gleichgewicht. Weiterhin wird diese Trennung nur durch Mischen aufrechterhalten. Jede andere vom Empfänger verfolgte reine Strategie führt zu einem Senderpooling, was bedeutet, dass das einzige reine Strategiegleichgewicht darin besteht, dass der Empfänger wählt . $m_1$ $a$ $r$ $m_2$ $a$ $\frac{3}{2}-\epsilon$ $r$

Ich sollte s im Bild unten für die Auszahlungen des Absenders auf der linken Seite an . Ich denke, das ist der Hauptbestandteil. $\beta$ $a$ $\beta<1$

Geben Sie hier die Bildbeschreibung ein

Pburg
quelle

Ich denke, dass dies bei risikoaversen Sendern, risikoneutralen Empfängern und reich genug sind, nicht passieren kann . $A$

Zum Beispiel und klebt auf das kanonische Signalisierungsmodell an , dass die positive reale Linie und Absender - Dienstprogramm ist in nimmt währenden Empfänger linear Nutzen hat in abnehm . $A$ $u$ $a$ $a$

(Zugegeben, dies ist nur eine teilweise Antwort, da der Rahmen viel weniger allgemein ist als der in Ihrer Frage, so dass er für Sie möglicherweise nicht zufriedenstellend ist. Ich gebe immer noch ein Argument, falls Sie mit diesen Annahmen einverstanden waren.)

Um einen Widerspruch abzuleiten sei angenommen , dass bei einer Gleichgewicht und für einen Teil . Lassen $\sigma^m_R(a') > 0$ $\sigma^m_R(a'') > 0$ $a' \neq a'' \in A$

a^{‴} \equiv \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{'} + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{″} .

$a''' \equiv \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } a' + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } a''.$

Durch Risikoaversion

u [a^{‴}] > \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{'}) + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{″}) .

$u[ a''' ] > \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a') + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a'').$

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{‴}) > σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a''' ) > \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Unter einer gewissen Kontinuitätsannahme muss es auch existieren

a^{⁗} < a^{‴}

$a '''' < a'''$

so dass

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{⁗}) = σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a'''' ) = \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Betrachten Sie also das folgendermaßen aufgebaut ist $\sigma^m_R{'}$

$\sigma^m_R{'}(a') = \sigma^m_R{'}(a'') = 0$ ,
$\sigma^m_R{'}(a'''') = \sigma^m_R(a'''') + [\sigma^m_R(a') + \sigma^m_R(a'')]$
Für alle anderen gilt $\tilde{a}$ $\sigma^m_R{'}(\tilde{a}) = \sigma^m_R(\tilde{a})$

Empfänger würden gegenüber wenn sie die von den gesendeten Signale nicht ändern würden, da dies geringere erwartete Kompensationen beinhaltet. Konstrukteure sind jedoch konstruktiv zwischen und , daher sollten sie dieselben Signale wie in . Somit kann kein Gleichgewicht sein, was zeigt, dass wir nicht zwei verschiedene Aktionen mit positiver Wahrscheinlichkeit bei einem Gleichgewicht spielen lassen können. $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R$ $\sigma^m_R$

Martin Van der Linden
quelle

Würde der Empfänger in diesem Modell nicht immer nur wählen ?

a = 0

$a=0$

Pburg

Ich weiß nicht, dass dies unbedingt der Fall ist. Wenn der Empfänger unabhängig vom Signal immer ein wählt, regt keine "hohen" Typen an, um ihren Typ durch ein "höheres" Signal zu enthüllen. Dies kann in einem Pooling-Gleichgewicht optimal sein, jedoch nicht in einem Trennungsgleichgewicht. Siehe zum Beispiel Abschnitt 13.C von Mas-Colell, Whinston und Green, obwohl sich das Setup wieder ein wenig von Ihrem unterscheidet (z. B. gibt es zwei Firmen, die um Arbeiter unterschiedlicher Typen konkurrieren)

a

$a$

Martin Van der Linden

Was bedeutet dann "Empfänger haben einen linearen Nutzen, der in a abnimmt"?

Pburg

Entschuldigung, das war nicht sehr klar. In dem Spence-Signalisierungsmodell, an das ich denke, besteht die Aktion des Empfängers darin, dem Absender einen Lohn w zu zahlen. Das Dienstprogramm des Empfängers hängt von der Art des Senders t abzüglich des gezahlten Lohns t - w ab. Grundsätzlich ist der Empfänger risikoneutral: Sie kümmert sich nur um den erwarteten Lohn, den sie zahlen muss, und den erwarteten Typ, den sie beschäftigen wird.

Martin Van der Linden

Okay, ich nehme an, ich habe dies als quadratischen Verlust gesehen,Vielen Dank für den Vorschlag, obwohl ich etwas allgemeineres suche, aber mit diskreten Aktionen.

- (t - w)^{2} .

$-(t-w)^2.$

Pburg