QUICK REVIEW

[论文解读] An Equilibrium Framework for Players with Misspecified Models

Ignacio Esponda, Demián Pouzo|arXiv (Cornell University)|Nov 5, 2014

Experimental Behavioral Economics Studies被引用 2

一句话总结

本文提出了一种伯克-纳什均衡框架，用于分析在模型误设条件下的战略互动，其中参与者使用主观模型，并通过最小化Kullback-Leibler散度来更新信念。该框架通过内生化信念准确性，将纳什均衡与自确认均衡扩展至更一般情形，为基于统计学与博弈论的动态学习过程提供了理论基础。

ABSTRACT

We develop an equilibrium framework that relaxes the standard assumption that people have a correctly-specified view of their environment. Each player is characterized by a (possibly misspecified) subjective model, which describes the set of feasible beliefs over payoff-relevant consequences as a function of actions. We introduce the notion of a Berk-Nash equilibrium: Each player follows a strategy that is optimal given her belief, and her belief is restricted to be the best fit among the set of beliefs she considers possible. The notion of best fit is formalized in terms of minimizing the Kullback-Leibler divergence, which is endogenous and depends on the equilibrium strategy profile. Standard solution concepts such as Nash equilibrium and self-confirming equilibrium constitute special cases where players have correctly-specified models. We provide a learning foundation for Berk-Nash equilibrium by extending and combining results from the statistics literature on misspecified learning and the economics literature on learning in games.

研究动机与目标

放松博弈论均衡分析中模型正确设定的标准假设。
形式化一种新的均衡概念——伯克-纳什均衡，其中参与者基于其考虑的模型中最佳拟合的主观信念进行优化。
通过将统计学习理论与动态博弈推理相结合，为该均衡提供学习基础。
展示当模型正确设定时，标准均衡（如纳什均衡与自确认均衡）可作为特殊情况出现。

提出的方法

提出一种伯克-纳什均衡，其中每个参与者的策略均在其主观模型下达到最优。
将‘最佳拟合’信念定义为相对于由均衡策略组合所诱导的经验分布，Kullback-Leibler散度最小的信念。
通过使散度度量依赖于实际行为（即均衡策略），实现对散度度量的内生化，从而使信念准确性能够随行为自适应调整。
利用统计学习理论证明，在重复博弈中信念会收敛至最佳拟合模型。
将统计学中误设学习的结果扩展至具有多个参与者的动态战略环境。
证明该均衡概念与参与者基于观测结果不断修正信念的学习过程保持一致。

实验结果

研究问题

RQ1当参与者对其环境持有误设模型时，如何定义均衡？
RQ2在重复博弈中，何种条件可确保参与者的信念收敛至一个一致且最佳拟合的模型？
RQ3伯克-纳什均衡与标准概念（如纳什均衡与自确认均衡）之间存在何种关系？它如何实现一般化？
RQ4能否为模型误设条件下的均衡建立学习基础？
RQ5Kullback-Leibler散度在战略环境中内生化信念选择的过程中起到何种作用？

主要发现

伯克-纳什均衡概念通过允许模型误设，推广了纳什均衡与自确认均衡。
均衡中的信念被正式定义为在均衡策略诱导的数据下，与经验分布Kullback-Leibler散度最小的模型。
该框架通过证明在重复博弈中信念更新会收敛至最佳拟合模型，为信念演化提供了学习基础。
即使参与者模型错误，该均衡仍与统计学习原理保持一致。
Kullback-Leibler散度被内生化，使信念准确性依赖于实际行为，而非外生假设。
该模型捕捉了在参与者持有错误但内部一致信念的环境中所呈现的真实学习动态。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。