QUICK REVIEW

[论文解读] Functional Decision Theory: A New Theory of Instrumental Rationality

Eliezer Yudkowsky, Nate Soares|arXiv (Cornell University)|Oct 13, 2017

Epistemology, Ethics, and Metaphysics参考文献 20被引用 25

一句话总结

本文提出功能决策理论（FDT），一种新的规范性决策理论，将决策视为固定数学函数的输出，旨在优化该函数的最佳结果。FDT在纽科姆悖论、吸烟病变问题及帕夫特搭便车问题中均优于因果决策理论（CDT）与证据决策理论（EDT），通过推理逻辑依赖与反事实依赖关系，而非因果或相关性，实现更高收益。

ABSTRACT

This paper describes and motivates a new decision theory known as functional decision theory (FDT), as distinct from causal decision theory and evidential decision theory. Functional decision theorists hold that the normative principle for action is to treat one's decision as the output of a fixed mathematical function that answers the question, "Which output of this very function would yield the best outcome?" Adhering to this principle delivers a number of benefits, including the ability to maximize wealth in an array of traditional decision-theoretic and game-theoretic problems where CDT and EDT perform poorly. Using one simple and coherent decision rule, functional decision theorists (for example) achieve more utility than CDT on Newcomb's problem, more utility than EDT on the smoking lesion problem, and more utility than both in Parfit's hitchhiker problem. In this paper, we define FDT, explore its prescriptions in a number of different decision problems, compare it to CDT and EDT, and give philosophical justifications for FDT as a normative theory of decision-making.

研究动机与目标

通过提出一种新的规范性框架，统一单智能体与多智能体情境下的工具理性，解决决策理论中长期存在的不一致性。
解决因果决策理论（CDT）与证据决策理论（EDT）的局限性，这些理论在纽科姆悖论与吸烟病变问题等关键决策问题中无法实现效用最大化。
提供一种有原则且一致的决策规则，通过聚焦于决策函数的逻辑输出，避免临时调整与预承诺机制。
证明FDT通过建模逻辑与心理相似性带来的反事实依赖，能在纽科姆类问题中持续实现高于CDT与EDT的期望效用。
为FDT建立哲学基础，作为基于功能与逻辑依赖而非因果或证据相关性的理性选择更优规范理论。

提出的方法

FDT将决策过程视为选择一个将输入（如世界模型）映射到行动的固定数学函数的输出，而非选择物理行为。
它将智能体建模为逻辑或功能上的孪生体，其中决策被视为共享决策函数的输出，从而在推理中产生反事实依赖。
该理论基于逻辑与反事实依赖进行反事实推理：'如果该函数输出不同行动，会发生什么？'
FDT使用基于函数的表示形式形式化决策问题，其中智能体评估每种可能函数输出的效用，而非物理行为的效用。
它区分因果、证据与功能依赖，以逻辑相关性（如心理孪生体中的关系）作为决策优化的基础。
该理论不依赖因果图或干预性反事实（如CDT所用），而是使用基于功能等价性的逻辑反事实。

实验结果

研究问题

RQ1如何使一种决策理论在纽科姆类问题中持续优于CDT与EDT？
RQ2何种规范性原则能统一单智能体与多智能体决策情境中的理性行为？
RQ3智能体如何通过推理逻辑依赖关系实现更高效用，而无需预承诺或约束机制？
RQ4反事实依赖在理性决策中的作用是什么？它与因果或证据依赖有何不同？
RQ5能否设计一种决策理论，既在逻辑上自洽，又在标准困境中实际优于CDT与EDT？

主要发现

在纽科姆悖论中，FDT建议选择单个盒子，获得1,000,000美元，而CDT建议选择两个盒子，仅获得1,000美元，因此在期望效用上优于CDT达1,000倍。
在吸烟病变问题中，FDT避免吸烟（理性行为），优于EDT，后者将吸烟视为好信号，导致更低效用。
在帕夫特搭便车问题中，FDT选择合作（支付车费），获得1,000,000美元，而CDT选择背叛并死亡，EDT则因证据顾虑未能合作。
在心理孪生体囚徒困境中，FDT通过合作实现相互合作，使双方各获得1,000,000美元，效用高于CDT与EDT。
FDT在勒索困境中抵抗勒索行为，形成稳定的投票联盟，并为信息赋予非负价值，而EDT则不具备此特性。
FDT无需通过确认程序或预承诺机制，因其通过功能推理可直接计算最优倾向。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。