Skip to main content
QUICK REVIEW

[论文解读] Stochastic nonzero-sum games: a new connection between singular control and optimal stopping

Tiziano De Angelis, Giorgio Ferrari|arXiv (Cornell University)|Jan 21, 2016
Stochastic processes and financial applications参考文献 48被引用 36
一句话总结

本文建立了一类双人非零和随机最优停止博弈与奇异控制博弈之间的新联系,表明通过吸收边界触发的最优停止博弈中的纳什均衡,可通过斯科罗霍德反射对应到奇异控制博弈中的纳什均衡。奇异控制博弈中各玩家的值函数通过对其在最优停止博弈中的值函数进行积分获得,从而在两种框架之间建立起微分联系。

ABSTRACT

In this paper we establish a new connection between a class of 2-player nonzero-sum games of optimal stopping and certain $2$-player nonzero-sum games of singular control. We show that whenever a Nash equilibrium in the game of stopping is attained by hitting times at two separate boundaries, then such boundaries also trigger a Nash equilibrium in the game of singular control. Moreover a differential link between the players' value functions holds across the two games.

研究动机与目标

  • 建立双人随机环境下非零和最优停止博弈与奇异控制博弈之间的新理论联系。
  • 刻画在何种条件下,具有阈值型策略的非零和最优停止博弈中的纳什均衡对应于奇异控制博弈中的均衡。
  • 推导出两种博弈之间值函数的微分关系,实现跨框架的解的转换。
  • 将奇异控制与最优停止之间已有的联系从单主体和零和情形扩展至非零和战略互动情形。
  • 通过验证定理及对一维扩散过程边界行为的分析,验证该对应关系的成立。

提出的方法

  • 作者建模了两类双人非零和博弈:一类涉及扩散过程 X 的最优停止,另一类涉及相关扩散过程 X̃ 的奇异控制。
  • 他们将最优停止博弈中的纳什均衡定义为在两个不同边界 a* 和 b* 处的首次 hitting 时间,玩家在离开区间 (a*, b*) 时退出。
  • 在奇异控制博弈中,玩家通过单调控制使 X̃ 保持在区间 [a*, b*] 内,并利用斯科罗霍德反射以最小化控制成本。
  • 奇异控制博弈中的值函数通过对其在最优停止博弈中对应值函数的积分构造而成。
  • 通过验证定理正式确立了两种博弈之间均衡策略的等价性。
  • 分析基于一维 Itô 扩散过程、Hamilton-Jacobi-Bellman 方程,以及受控动态下反射扩散的性质。

实验结果

研究问题

  • RQ1在何种条件下,双人非零和最优停止博弈中的纳什均衡对应于相关奇异控制博弈中的纳什均衡?
  • RQ2奇异控制博弈中两名玩家的值函数与他们在最优停止博弈中的值函数有何关系?
  • RQ3能否利用最优停止博弈中触发停止的阈值来定义奇异控制博弈中的斯科罗霍德反射策略,从而实现纳什均衡?
  • RQ4成本函数 G_i 和奖励函数 L_i 的结构在确保两种博弈之间对应关系中起到何种作用?
  • RQ5两种博弈之间值函数的微分关系如何从底层随机动态和边界条件中自然产生?

主要发现

  • 在最优停止博弈中通过在两个不同边界 a* 和 b* 处 hitting 时间实现的纳什均衡,可通过斯科罗霍德反射机制对应到奇异控制博弈中,使过程保持在 [a*, b*] 区间内,从而诱导出相应的纳什均衡。
  • 奇异控制博弈中每位玩家的值函数通过对其在最优停止博弈中对应值函数的积分获得,从而在两种框架之间建立起微分联系。
  • 当底层扩散过程的漂移和扩散系数满足正则性条件,且成本/奖励函数 G_i 和 L_i 在两种博弈中保持一致时,该对应关系成立。
  • 最优停止博弈中存在阈值型纳什均衡,意味着在奇异控制博弈中存在一种最小控制成本的控制策略(即斯科罗霍德反射),该策略构成纳什均衡。
  • 该结果将奇异控制与最优停止之间已知的联系从单主体和零和情形扩展至非零和战略互动情形,显著拓宽了此类联系的应用范围。
  • 先前工作的反例表明此类联系并非自动成立,但本文识别出在非零和情形下该联系稳健成立的充分条件。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。