QUICK REVIEW

[논문 리뷰] Numerical Asymptotic Results in Game Theory Using Sergeyev's Infinity Computing

Lorenzo Fiaschi, Marco Cococcioni|arXiv (Cornell University)|2018. 08. 02.

Mathematical and Theoretical Analysis인용 수 26

한 줄 요약

이 논문은 Sergeyev의 무한수 계산(Infinity Computing)을 사용하여 무한, 유한, 무한소 지급을 포함하는 협력자 간의 딜레마 토너먼트를 분석하는 새로운 수치적 프레임워크를 제안한다. 그로스본 방법론을 활용함으로써, 유한한 횟수의 반복적 상호작용이 이루어지는 협력자 간의 딜레마 게임에서 정확한 결과 계산이 가능해지며, 이는 최적의 지급 조정이 무한소 간격 내에서 발생함을 드러내어, 고전적 극한 기반 분석의 한계를 극복한다.

ABSTRACT

Prisoner's Dilemma (PD) is a widely studied game that plays an important role in Game Theory. This paper aims at extending PD Tournaments to the case of infinite, finite or infinitesimal payoffs using Sergeyev's Infinity Computing (IC). By exploiting IC, we are able to show the limits of the classical approach to PD Tournaments analysis of the classical theory, extending both the sets of the feasible and numerically computable tournaments. In particular we provide a numerical computation of the exact outcome of a simple PD Tournament where one player meets every other an infinite number of times, for both its deterministic and stochastic formulations.

연구 동기 및 목표

무한히 반복되는 협력자 간의 딜레마 토너먼트에서 상호작용 횟수가 무한할 경우 고전적 극한 이론의 한계를 극복하기 위해.
유한 지급 가정을 넘어서 가능한 유한, 무한, 무한소 지급을 동시에 처리할 수 있는 PD 토너먼트의 집합을 확장하기 위해.
게임 이론적 맥락에서 무한, 유한, 무한소 지급을 동시에 다룰 수 있는 수치적 프레임워크를 제공하기 위해.
무한 상호작용을 포함하는 결정론적 및 확률적 PD 토너먼트에 대해 정확한 결과를 계산하는 데서 무한수 계산의 실현 가능성과 정밀도를 입증하기 위해.

제안 방법

무한수와 무한소 수량을 하나의 일관된 숫자 체계에서 표현하고 계산하기 위해 Sergeyev의 무한수 계산(IC)과 그로스본 방법론을 사용한다.
자연수의 기수를 나타내는 새로운 무한 단위인 그로스본(①)을 도입하여, 무한 및 무한소 양의 산술 연산을 가능하게 한다.
특히 도전 지급 T에 중점을 두고, 표준 PD 지급 구조를 수정하여 지급 행렬에 무한 및 무한소 값을 허용한다.
상호작용 횟수가 ①에 가까워질 때의 반복 PD 게임에서 총 지급 차이에 대한 점점의 표현식을 유도하며, 이는 ①에 대한 기호 전개를 통해 유도된다.
결정론적 및 확률적 공식화에 모두 적용하여, 무한 상호작용일 때 승리하기 위해 지급 T가 있어야 하는 정확한 간격을 계산한다.
무한소 변화 δT, δR, δP를 포함하는 수정된 지급 차이 함수 Δ̃(·)을 사용하며, ①를 포함한 부등식 시스템으로 승리 조건을 표현한다.

실험 결과

연구 질문

RQ1각 플레이어가 다른 플레이어와 무한히 많은 번 수차례 상호작용할 경우 협력자 간의 딜레마 토너먼트 결과는 어떻게 되는가?
RQ2고전적 극한에 의존하지 않고 게임 이론적 맥락에서 무한 및 무한소 지급을 정확하게 수치적으로 계산하고 비교할 수 있는 방법은 무엇인가?
RQ3무한히 반복되는 PD 토너먼트에서 승자를 결정짓는 지급 조정의 정확한 간격(특히 T에 대한 것)은 무엇인가?
RQ4그로스본 방법론은 무한 상호작용을 포함하는 반복 게임을 분석하기 위한 일관되고 수치적으로 다룰 수 있는 프레임워크를 제공할 수 있는가?

주요 결과

상호작용 횟수 n이 무한 단위 ①으로 설정되면, 플레이어가 승리하기 위해 도전 지급 T가 있어야 하는 간격의 너비는 무한소 간격이 되며, 구체적으로 W = τ / (μₖⱼ³① + λₖⱼ³)로 표현된다.
승리 간격의 너비 W는 δT, δR, δP의 구체적 값과는 무관하게 τ 및 유한 계수 μₖⱼ³와 λₖⱼ³에만 의존하므로, 작은 지급 변화에 대해 강건함을 보인다.
무한 상호작용 하에서 승리 전략이 존재하기 위해서는 지급 T가 S를 중심으로 하는 무한소 간격 내에 있어야 하며, 너비는 W = τ / (μₖⱼ³① + λₖⱼ³)로 주어지며, 이는 지급 차이 함수의 점점 행동에서 유도된다.
분석 결과 승리 조건은 μₖⱼ³의 부호에 따라 달라지며, 이는 부등식 시스템 (20)과 (21)에서 두 가지 다른 경우로 나뉘게 되어 δT의 범위를 결정한다.
이 방법은 무한 상호작용을 포함하는 확률적 PD 토너먼트의 정확한 결과를 성공적으로 계산하였으며, 승리 전략은 유한한 지급 차이가 아니라 무한소 조정에 의해 결정됨을 보여준다.
이 프레임워크는 고전적 게임 이론에서 발산하거나 정의되지 않은 극한으로 인해 이전에는 다룰 수 없었던 상황에서도 결과의 수치적 계산을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.