[論文レビュー] Continuation-Performance Decomposition in Dynamic Games with Irreversible Failure
要約: 本論文は、吸収失敗を持つ動的ゲームに対して継続–性能分解(CPD)を導入し、継続と性能は語順的に評価されるべきであることを示し、CPDが大きな罰 payoff 极限と等価であることを証明し、実現可能性と銀行取り付け(バンクラン)への応用を議論する。
Once failure is irreversible, continuation payoffs cannot be meaningfully aggregated across strategies that differ in their survival properties. Standard scalar evaluation sidesteps this by arbitrarily completing payoffs beyond termination, but such completions are extrinsic to the game form. This paper introduces continuation-performance decomposition (CPD), proving that any evaluation satisfying natural regularity conditions, such as failure-completion invariance, survival locality, and local expected-utility coherence -- must separate continuation from performance lexicographically. Continuation priority thus emerges as a consequence of well-posed evaluation, not as a behavioral assumption. We establish equivalence between CPD and the limit of games with diverging failure penalties, show that viability is a game-form invariant independent of payoffs, and apply the framework to bank runs: preemptive withdrawals reflect rational viability vetoes rather than coordination failure when continuation is distributively asymmetric. CPD resolves a representational problem, not a preference problem.
研究の動機と目的
- 問題の動機づけ: 不可逆的な失敗は標準的なスカラー評価の下で継続報酬を ill-posed(適切に定まらない)にする。
- 継続と性能を分離する表現を提案して内在的評価を回復。
- 失敗下での典型的内在評価を特徴づけ、その語順的構造を示す。
- 大規模罰付 payoff 极限との同等性を実証し、実現可能性とバンクランの影響を議論。
提案手法
- 吸収失敗とランダム失敗時間 T を持つ動的ゲーム形式を定義。
- 継続プロファイル C(σ) と条件付き継続 payoff Ũi(σ) を導入。
- 語順付けを用いた静的正規形評価として CPD を (C(σ), Ũi(σ)) の組で構成。
- 内在性制約を課す:失敗完遂不変性、生存局所性、局所期待効用整合性。
- Canonical 分解を証明:CPD はこれらの制約と tail- vs. performance-分離から生じる。
- 大きな罰付 payoff ゲームとの同等性を確立し、実現可能性と情報感度を分析。
実験結果
リサーチクエスチョン
- RQ1吸収失敗を持つ動的ゲームを外部報酬完成なしに内在的に評価するにはどうすればよいか。
- RQ2自然な内在性と局所性条件の下で canonical な継続–性能分解(CPD)は存在するか。
- RQ3CPD は発散する失敗罰の極限のゲームとどのように関連するか。
- RQ4実務モデル(銀行取り付けのような)における CPD の構造的性質(実現可能性、情報感度)はどうなるか。
主な発見
- 不可逆的な失敗の下での内在的評価規則は、継続( tail)と条件付き性能の語順的分離を意味する。
- CPD が存在し、罰付の極限極限(penalty-limit)と等価であることが分かる。
- 実現可能性保持戦略は報酬とゲーム形式に不変であり、実現不能な結果は失敗で終了することを保証。
- 吸収失敗に対して unconditional なスカラー集約は内在的ではなく、継続定義域に限定することで CPD が回避する。
- 局所的等価性は CPD が継続結びつきにおける標準的期待効用に縮約されることを示す。
- 大きな罰付の下で、CPD 表現のナッシュ均衡(均衡対応)に収束する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。