Skip to main content
QUICK REVIEW

[논문 리뷰] Functional Decision Theory: A New Theory of Instrumental Rationality

Eliezer Yudkowsky, Nate Soares|arXiv (Cornell University)|2017. 10. 13.
Epistemology, Ethics, and Metaphysics참고 문헌 20인용 수 25
한 줄 요약

이 논문은 기능적 의사결정 이론(FDT)을 소개한다. FDT는 의사결정을 고정된 수학적 함수의 출력으로 간주하며, 그 함수의 최적 결과를 추구하는 새로운 범용 의사결정 이론이다. FDT는 뉴콤의 문제, 담배 레이지 문제, 파르피의 하이커 문제에서 기존의 인과적 의사결정 이론(CDT)과 증거 기반 의사결정 이론(EDT)을 모두 능가하며, 인과성이나 상관관계가 아닌 논리적 및 조건적 의존성에 기반한 추론을 통해 더 높은 기대 효용을 달성한다.

ABSTRACT

This paper describes and motivates a new decision theory known as functional decision theory (FDT), as distinct from causal decision theory and evidential decision theory. Functional decision theorists hold that the normative principle for action is to treat one's decision as the output of a fixed mathematical function that answers the question, "Which output of this very function would yield the best outcome?" Adhering to this principle delivers a number of benefits, including the ability to maximize wealth in an array of traditional decision-theoretic and game-theoretic problems where CDT and EDT perform poorly. Using one simple and coherent decision rule, functional decision theorists (for example) achieve more utility than CDT on Newcomb's problem, more utility than EDT on the smoking lesion problem, and more utility than both in Parfit's hitchhiker problem. In this paper, we define FDT, explore its prescriptions in a number of different decision problems, compare it to CDT and EDT, and give philosophical justifications for FDT as a normative theory of decision-making.

연구 동기 및 목표

  • 단일 및 다중 에이전트 상황에서의 도구적 합리성을 통합하는 새로운 규범적 프레임워크를 제안하여 의사결정 이론에서 오랫동안 지속된 모순을 해결하는 것.
  • 뉴콤의 문제나 담배 레이지 문제와 같은 핵심 의사결정 문제에서 효용을 최대화하지 못하는 인과적 의사결정 이론(CDT)과 증거 기반 의사결정 이론(EDT)의 한계를 해결하는 것.
  • 논리적 의사결정 함수의 출력에 초점을 맞춤으로써 괴짜적인 조정이나 사전 약속 메커니즘에 의존하지 않는 원칙적이고 일관된 의사결정 규칙을 제공하는 것.
  • 논리적 및 심리적 유사성에 기반한 조건적 의존성 모델링을 통해 FDT가 뉴콤 유사 문제에서 CDT와 EDT보다 항상 더 높은 기대 효용을 달성함을 보여주는 것.
  • 기능적 및 논리적 의존성에 기반한 철학적 기초를 마련하여 FDT를 인과적 또는 증거적 상관관계가 아닌 더 뛰어난 규범적 합리적 선택 이론으로 확립하는 것.

제안 방법

  • 의사결정을 물리적 행동을 선택하는 것이 아니라, 입력(예: 세계 모델)을 행동으로 매핑하는 고정된 수학적 함수의 출력을 선택하는 것으로 프레임워크화한다.
  • 에이전트를 논리적 또는 기능적 쌍둥이로 모델링하여 의사결정을 공유된 의사결정 함수의 출력으로 간주함으로써 추론에서 조건적 의존성을 이끌어내는 방식이다.
  • 이론은 논리적 및 조건적 의존성에 기반한 반사적 추론을 사용한다: "만약 이 함수가 다른 행동을 출력했을 경우 어떤 일이 일어날까?"
  • 에이전트가 물리적 행동이 아닌 가능한 함수 출력의 효용을 평가함으로써 의사결정 문제를 기능 기반 표현으로 형식화한다.
  • 인과적, 증거적, 기능적 의존성을 구분하며, 심리적 쌍둥이에서의 논리적 상관관계(예: 유사성)를 기반으로 의사결정 최적화를 수행한다.
  • 이론은 CDT에서처럼 인과적 그래프나 간섭 기반 반사적 추론에 의존하지 않고, 기능적 동치성에 기반한 논리적 반사적 추론을 사용한다.

실험 결과

연구 질문

  • RQ1어떻게 의사결정 이론이 뉴콤 유사 문제에서 CDT와 EDT를 일관되게 능가할 수 있는가?
  • RQ2단일 에이전트와 다중 에이전트 의사결정 시나리오에서 합리적 행동을 통합하는 규범적 원칙은 무엇인가?
  • RQ3논리적 의존성에 기반한 추론을 통해 사전 약속이나 구속 메커니즘 없이 어떻게 더 높은 효용을 달성할 수 있는가?
  • RQ4조건적 의존성은 합리적 의사결정에서 어떤 역할을 하는가? 그리고 그것이 인과적 또는 증거적 의존성과 어떻게 다를까?
  • RQ5기능적 일관성과 실용적 우월성이 표준 딜레마에서 CDT와 EDT를 능가하는 의사결정 이론은 가능할까?

주요 결과

  • 뉴콤의 문제에서 FDT는 한 상자 선택을 권고하여 1,000,000달러를 얻지만, CDT는 두 상자 선택을 권고하여 단지 1,000달러를 얻는다. 따라서 FDT는 기대 효용 측면에서 CDT를 1,000배 뛰어넘는다.
  • 담배 레이지 문제에서 FDT는 흡연을 피하는(합리적인 행동) 것으로서 EDT를 능가한다. EDT는 흡연을 좋은 신호로 보고 흡연을 권장하여 더 낮은 효용을 초래한다.
  • 파르피의 하이커 문제에서 FDT는 협력(요금 지불)을 선택하여 1,000,000달러를 얻지만, CDT는 배신하여 죽고, EDT는 증거적 우려로 인해 협력하지 못한다.
  • 심리적 쌍둥이 협력자 딜레마에서 FDT는 협력함으로써 상호 협력 상태를 이끌어내며 각자 1,000,000달러의 효용을 달성한다.
  • FDT는 협박 딜레마에서 협박에 저항하며 안정적인 투표 연합을 형성하며, 정보에 대해 음수 이외의 가치를 할당한다. 반면 EDT는 그렇지 않다.
  • FDT는 승인 절차나 사전 약속이 필요로 하지 않으며, 기능적 추론을 통해 최적의 사전 태도를 직접 계산한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.