[论文解读] A Formal Measure of Machine Intelligence
本文提出了一种形式化、数学上严格的机器智能度量方法,基于智能体在广泛环境中的问题求解能力,结合算法复杂度与通用先验。该方法将智能形式化为在所有可计算环境中的期望性能,按其算法概率加权,提供一种客观、可计算且普遍适用的机器智能评估标准,超越人类中心或模仿测试的局限。
A fundamental problem in artificial intelligence is that nobody really knows what intelligence is. The problem is especially acute when we need to consider artificial systems which are significantly different to humans. In this paper we approach this problem in the following way: We take a number of well known informal definitions of human intelligence that have been given by experts, and extract their essential features. These are then mathematically formalised to produce a general measure of intelligence for arbitrary machines. We believe that this measure formally captures the concept of machine intelligence in the broadest reasonable sense.
研究动机与目标
- 解决缺乏一种普遍适用、形式化的机器智能定义的问题,该定义超越人类中心或任务特定的测试。
- 开发一种度量方法,捕捉智能作为在不确定、动态环境中解决问题能力的本质。
- 建立一种客观、数学精确且计算上可行的标准,用于比较各类人工系统的智能水平。
- 通过将智能建立在算法信息论基础上,克服现有测试(如图灵测试和序列预测基准)的局限性。
- 为评估机器智能提供一种不依赖硬件、感官模态或环境结构的不变基础。
提出的方法
- 该框架将智能建模为智能体在所有可能可计算环境中的期望性能,按其算法概率(基于柯尔莫哥洛夫复杂度)加权。
- 将智能定义为在所有环境中性能的平均值,其中性能通过智能体在每个环境中获得的累积奖励来衡量。
- 环境分布源自索洛莫诺夫的通用先验 2^(-K(μ)),该先验根据环境的算法复杂度为其分配更高的概率。
- 通过通用图灵机和一种动态适应智能体行为的通用智能测试,对度量进行形式化。
- 该方法在通用图灵机的选择上具有不变性,仅受常数因子影响,确保在不同计算模型下的鲁棒性。
- 建议使用李文的 Kt 复杂度或施密德胡伯的速度先验作为柯尔莫哥洛夫复杂度不可计算性的实用近似。
实验结果
研究问题
- RQ1如何以一种普遍适用于所有人工系统的方式正式定义智能,无论其硬件或感官模态如何?
- RQ2人类智能的核心特征(如学习、适应和问题求解)能否被数学上严谨的度量所捕捉?
- RQ3能否构建一个单一、客观且可计算的智能度量,以避免图灵测试等测试中固有的主观性和偏见?
- RQ4在保持智能度量理论严谨性的同时,如何解决柯尔莫哥洛夫复杂度不可计算性的问题?
- RQ5所提出的度量在多大程度上反映了智能作为适应性和通用问题求解能力的直观概念?
主要发现
- 所提出的智能度量 Υ 形式化定义为智能体在所有可计算环境中的期望性能,按其算法概率 2^(-K(μ)) 加权。
- 该度量在通用图灵机的选择上具有不变性,仅受乘法常数影响,确保理论上的稳健性。
- 该度量本质上是动态且交互式的,不同于静态的序列预测测试,因此更能捕捉适应性和学习行为。
- 该度量是客观的,无需人类判断,从而与图灵测试及其他基于模仿的评估方法相区别。
- 尽管由于柯尔莫哥洛夫复杂度的不可判定性,精确度量不可计算,但使用 Kt 或速度先验的实用近似是可行且理论成立的。
- 该形式化被证明与 AIXI 框架中的智能序关系等价,为其在成熟通用智能体理论中的根基提供了支持。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。