Skip to main content
QUICK REVIEW

[论文解读] Non-cooperative games with preplay negotiations

Valentin Goranko, Paolo Turrini|arXiv (Cornell University)|Aug 8, 2012
Game Theory and Applications参考文献 36被引用 4
一句话总结

本文提出了一种非合作博弈的框架,包含一个事前协商阶段,玩家在此阶段作出具有约束力的承诺,承诺在游戏结束后根据特定策略的执行情况转移效用。通过这些承诺对收益矩阵进行变换,作者表明即使在缺乏合作的情况下,也能在各种协商结构(包括条件性与顺序性承诺)下实现高效均衡——例如在囚徒困境等博弈中实现帕累托最优结果。

ABSTRACT

We consider an extension of strategic normal form games with a phase of negotiations before the actual play of the game, where players can make binding offers for transfer of utilities to other players after the play of the game, in order to provide additional incentives for each other to play designated strategies. Such offers are conditional on the recipients playing the specified strategies and they effect transformations of the payoff matrix of the game by accordingly transferring payoffs between players. We introduce and analyze solution concepts for 2-player normal form games with such preplay offers under various assumptions for the preplay negotiation phase and obtain results for existence of efficient negotiation strategies of the players. Then we extend the framework to coalitional preplay offers in N-player games, as well as to extensive form games with inter-play offers for side payments.

研究动机与目标

  • 通过引入事前协商阶段,解决正常形式博弈中的低效问题,例如囚徒困境中的帕累托劣效纳什均衡。
  • 建模现实世界的战略互动(如贿赂、回扣和法律和解),其中玩家在进行博弈前协商附带支付。
  • 形式化一个非合作框架,其中承诺仅对提议者具有约束力,从而保持博弈的非合作性质。
  • 在各种假设下(包括无条件与条件性承诺),分析高效协商策略的存在性与性质。
  • 启动对事前协商的系统性研究,作为连接非合作与合作博弈理论的桥梁,适用于扩展形式与联盟博弈情境。

提出的方法

  • 引入事前承诺,即玩家A对玩家B作出具有约束力的承诺:若B执行指定策略σ,则A将在游戏结束后支付δ单位效用。
  • 通过将δ从A的收益转移到B的收益,在B执行σ的所有策略组合中,对原始收益矩阵进行变换。
  • 将结果博弈视为具有修改后收益的非合作正常形式博弈,同时保持战略激励不变。
  • 将模型扩展至条件性承诺,其中玩家的承诺依赖于收到对应回报承诺,从而支持动态谈判序列。
  • 应用纳什均衡与逆向归纳等解概念,分析不同协商结构下的结果。
  • 以鲁宾斯坦风格的谈判模型为基础,分析游戏前的扩展形式协商阶段。

实验结果

研究问题

  • RQ1在正常形式博弈中,事前承诺能否诱导出更高效的均衡,例如在囚徒困境中实现帕累托最优结果?
  • RQ2在顺序协商阶段中,条件性承诺在何种条件下能导致双人博弈中的高效且公平的结果?
  • RQ3事前协商的结构(例如顺序承诺、时间折现或撤回权利)如何影响高效协商策略的存在性?
  • RQ4当接收方不受承诺约束时,玩家作出承诺的战略激励是什么?这些激励如何影响最终均衡?
  • RQ5该框架如何扩展至N人博弈与扩展形式博弈,特别是在涉及联盟承诺或游戏中互动承诺的情境下?

主要发现

  • 在囚徒困境中,若行玩家向列玩家作出具有约束力的承诺:若列玩家选择C,则支付2单位效用,游戏将被重构,使得(D, C)成为唯一的纳什均衡,收益为(3, 2),严格优于原始的(1, 1)。
  • 当双方均作出互惠承诺(例如,各自承诺为合作支付2单位效用)时,博弈被转化为新的收益矩阵,使得(C, C)成为唯一的纳什均衡,收益为(4, 4),实现帕累托最优结果。
  • 该框架即使在无纯策略纳什均衡或存在低效均衡的博弈中,也能实现高效协商策略的存在,通过战略性附带支付实现。
  • 条件性承诺(即承诺依赖于对应回报)可通过动态谈判促成高效均衡的出现,扩展了[GT13]中的结果。
  • 事前协商阶段可建模为扩展形式博弈,且在合理假设下(例如时间折现),可通过逆向归纳或子博弈完美均衡实现高效结果。
  • 该模型保持了博弈的非合作性质,因为仅提议者受承诺约束,而接收方保留在选择行动时的完全战略自由。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。