QUICK REVIEW

[論文レビュー] An Equilibrium Framework for Players with Misspecified Models

Ignacio Esponda, Demián Pouzo|arXiv (Cornell University)|Nov 5, 2014

Experimental Behavioral Economics Studies被引用数 2

ひとこと要約

本稿は、モデルの誤り指定下での戦略的相互作用に適したBerk-Nash均衡枠組みを導入する。プレイヤーは主観的モデルを用い、ベイズ的更新に代わるKullback-Leibler発散の最小化によって信念を更新する。この枠組みは、ナッシュ均衡と自己確認均衡を一般化し、信念の正確さを内生化することで、統計学とゲーム理論に根ざした学習的基盤を提供する。

ABSTRACT

We develop an equilibrium framework that relaxes the standard assumption that people have a correctly-specified view of their environment. Each player is characterized by a (possibly misspecified) subjective model, which describes the set of feasible beliefs over payoff-relevant consequences as a function of actions. We introduce the notion of a Berk-Nash equilibrium: Each player follows a strategy that is optimal given her belief, and her belief is restricted to be the best fit among the set of beliefs she considers possible. The notion of best fit is formalized in terms of minimizing the Kullback-Leibler divergence, which is endogenous and depends on the equilibrium strategy profile. Standard solution concepts such as Nash equilibrium and self-confirming equilibrium constitute special cases where players have correctly-specified models. We provide a learning foundation for Berk-Nash equilibrium by extending and combining results from the statistics literature on misspecified learning and the economics literature on learning in games.

研究の動機と目的

ゲーム理論的均衡分析における標準的な正しく指定されたモデルの仮定を緩和すること。
プレイヤーが自身の考えうるモデルの中で最良の適合性を示す主観的信念に基づいて最適化する、新しい均衡概念「Berk-Nash」を形式化すること。
統計学習理論と動的ゲーム理論的推論を統合することで、この均衡に学習的基盤を提供すること。
モデルが正しく指定された場合に、ナッシュ均衡や自己確認均衡が特別な場合として現れることを示すこと。

提案手法

各プレイヤーの戦略がその主観的モデルのもとで最適であるBerk-Nash均衡を提唱する。
「最良適合」信念を、均衡戦略プロファイルによって誘導される経験的分布からのKullback-Leibler発散を最小化するものとして定義する。
実際の行動（均衡戦略）に依存するように発散測度を内生化することで、信念の正確さを行動に適応させる。
統計学習理論を用いて、繰り返しの対戦において信念が最良適合モデルに収束することを正当化する。
統計学における誤り指定学習の結果を、複数のエージェントが関与する動的で戦略的環境へと拡張する。
プレイヤーが観測結果に基づいて信念を精錬する学習プロセスと整合する均衡概念であることを示す。

実験結果

リサーチクエスチョン

RQ1プレイヤーが環境について誤ったモデルを持つ場合に、どのように均衡を定義できるか？
RQ2繰り返し対戦において、プレイヤーの信念が一貫性を持ち、最良適合モデルに収束するための条件は何か？
RQ3Berk-Nash均衡は、ナッシュ均衡や自己確認均衡といった標準的概念とどのように関係し、一般化されるか？
RQ4モデルの誤り指定下での均衡に学習的基盤を確立できるか？
RQ5Kullback-Leibler発散は、戦略的状況における信念選択を内生化するために果たす役割は何か？

主な発見

Berk-Nash均衡概念は、モデルの誤り指定を許容することで、ナッシュ均衡と自己確認均衡を一般化する。
均衡における信念は、均衡戦略のもとで観測データに対する最小Kullback-Leibler発散の適合性として形式的に定義される。
繰り返し対戦における信念更新が最良適合モデルに収束することを示すことで、学習的基盤を提供する。
プレイヤーのモデルが誤りであっても、均衡は統計的学習の原則と整合的である。
Kullback-Leibler発散は内生化されており、信念の正確さが外生的仮定ではなく、実際の行動に依存する。
本モデルは、誤りであるが内部的に一貫性を持つ信念を持つエージェントが経験する現実的な学習ダイナミクスを捉えている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。