QUICK REVIEW

[論文レビュー] Numerical Asymptotic Results in Game Theory Using Sergeyev's Infinity Computing

Lorenzo Fiaschi, Marco Cococcioni|arXiv (Cornell University)|Aug 2, 2018

Mathematical and Theoretical Analysis被引用数 26

ひとこと要約

本稿は、Sergeyevの無限大計算（Infinity Computing）を用いて、無限、有限、無限小の報酬を持つ囚人のジレンマ大会を分析する新しい数値フレームワークを導入する。グロスオネ（Grossone）手法を活用することで、無限回繰り返されるPDゲームにおける結果を正確に計算可能にし、最適な報酬調整が無限小の区間内で発生することを明らかにした。これにより、古典的極限に基づく分析の限界を克服した。

ABSTRACT

Prisoner's Dilemma (PD) is a widely studied game that plays an important role in Game Theory. This paper aims at extending PD Tournaments to the case of infinite, finite or infinitesimal payoffs using Sergeyev's Infinity Computing (IC). By exploiting IC, we are able to show the limits of the classical approach to PD Tournaments analysis of the classical theory, extending both the sets of the feasible and numerically computable tournaments. In particular we provide a numerical computation of the exact outcome of a simple PD Tournament where one player meets every other an infinite number of times, for both its deterministic and stochastic formulations.

研究の動機と目的

無限回繰り返される囚人のジレンマ大会における古典的極限理論の限界を克服すること。
有限報酬の仮定にとらわれない、より広い範囲の実行可能で数値的に計算可能なPD大会を拡張すること。
ゲーム理論的状況において、無限、有限、無限小の報酬を同時に取り扱える数値フレームワークを提供すること。
無限回の相互作用を伴う決定論的および確率的PD大会において、無限大計算が正確な結果を計算する可能性と精度を実証すること。

提案手法

Sergeyevの無限大計算（IC）およびグロスオネ手法を用いて、単一の一貫した記数法システム内で無限大および無限小の数を表現・計算する。
自然数の濃度を表す新しい無限大単位としてグロスオネ（①）を導入し、無限大および無限小の量の算術を可能にする。
標準的なPD報酬構造を変更し、報酬行列に無限大および無限小の値を許容するようにし、特に誘因報酬Tに焦点を当てる。
相互作用回数が①に近づく際の繰り返しPDゲームにおける報酬差の漸近的表現を、①を変数とする記号的展開を用いて導出する。
決定論的および確率的定式化の両方にこの手法を適用し、無限回の相互作用下でプレイヤーが勝利するための報酬Tが含まれるべき正確な区間を計算する。
無限小の摂動δT、δR、δPを組み込んだ修正された報酬差関数Δ̃(·)を導入し、勝利条件を①を含む不等式系として表現する。

実験結果

リサーチクエスチョン

RQ1各プレイヤーが他の全プレイヤーと無限回相互作用する場合、囚人のジレンマ大会の結果はどのように変化するか？
RQ2古典的極限に依存せずに、ゲーム理論的状況で無限大および無限小の報酬を数値的に計算・比較する方法は何か？
RQ3無限回繰り返しPD大会において、勝者を決定づける報酬調整（特にT）の正確な区間は何か？
RQ4グロスオネ手法は、無限回の相互作用を伴う繰り返しゲームを分析するための一貫性があり、数値的に取り扱いやすいフレームワークを提供できるか？

主な発見

相互作用回数nが無限大単位①に設定された場合、プレイヤーが勝利するための誘因報酬Tが含まれるべき区間の幅は無限小にまで小さくなり、具体的にはW = τ / (μₖⱼ³① + λₖⱼ³) となる。
勝利区間の幅Wは、δT、δR、δPの具体的な値に依存せず、τおよび有限係数μₖⱼ³とλₖⱼ³にのみ依存するため、小さな報酬摂動に対して頑健であることが示された。
無限回の相互作用下で勝利戦略が存在するためには、報酬TがSを中心とする無限小の区間内に位置しなければならず、その幅はW = τ / (μₖⱼ³① + λₖⱼ³) で与えられる。これは報酬差関数の漸近的挙動から導出されたものである。
解析により、勝利条件はμₓⱼ³の符号に依存し、不等式系(20)および(21)において2つの異なるケースが生じ、δTの境界を決定づける。
本手法は、無限回の相互作用を伴う確率的PD大会の正確な結果を成功裏に計算でき、勝利戦略は有限の報酬差ではなく、Tに対する無限小の調整に依存することが示された。
このフレームワークにより、発散または未定義の極限に起因して従来のゲーム理論では取り扱えなかった状況においても、結果の数値的計算が可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。