Skip to main content
QUICK REVIEW

[论文解读] From Machine Learning to Machine Reasoning

Léon Bottou|arXiv (Cornell University)|Feb 9, 2011
Machine Learning and Algorithms参考文献 20被引用 24
一句话总结

本文提出了一种机器推理的理论框架,将其视为对训练好的机器学习组件进行代数操作,认为推理可自然地从模块化学习系统的组合与微调中涌现。通过将系统组合视为代数运算,该方法无需依赖显式的符号或概率推理引擎,即可实现从学习到推理的连续路径,通过模块化整合与调优实现推理能力。

ABSTRACT

A plausible definition of "reasoning" could be "algebraically manipulating previously acquired knowledge in order to answer a new question". This definition covers first-order logical inference or probabilistic inference. It also includes much simpler manipulations commonly used to build large learning systems. For instance, we can build an optical character recognition system by first training a character segmenter, an isolated character recognizer, and a language model, using appropriate labeled training sets. Adequately concatenating these modules and fine tuning the resulting system can be viewed as an algebraic operation in a space of models. The resulting model answers a new question, that is, converting the image of a text page into a computer readable text. This observation suggests a conceptual continuity between algebraically rich inference systems, such as logical or probabilistic inference, and simple manipulations, such as the mere concatenation of trainable learning systems. Therefore, instead of trying to bridge the gap between machine learning systems and sophisticated "all-purpose" inference mechanisms, we can instead algebraically enrich the set of manipulations applicable to training systems, and build reasoning capabilities from the ground up.

研究动机与目标

  • 将机器推理重新定义为并非一种独立能力,而是对已有学习模型的代数操作。
  • 通过展示推理可从模块化组合中涌现,弥合机器学习系统与高层推理之间的感知鸿沟。
  • 通过丰富可应用于可训练模型的代数运算集合,提出一条实用且可扩展的推理路径。
  • 证明复杂推理任务(如文本识别)可通过系统性地组合更简单的训练组件来实现。

提出的方法

  • 将推理定义为对已学习模型的代数操作,其中操作包括模块的连接、微调和组合。
  • 使用模块化学习系统(如字符分割器、孤立字符识别器和语言模型)作为构建模块。
  • 对组合后的系统进行微调,以优化其在新任务上的性能,将其视为一种推理形式。
  • 将该过程形式化为一个模型空间,其中操作在训练好的组件上定义,从而通过组合实现系统性推理。
  • 将简单模型组合与复杂推理系统(如逻辑或概率推理)进行类比。
  • 将该方法定位为从学习到推理的连续谱系,避免两者之间出现突兀的分界。

实验结果

研究问题

  • RQ1推理是否可以通过训练好的机器学习模型的代数组合实现,而非依赖专用推理引擎?
  • RQ2如何在不引入新的符号或概率形式化体系的前提下,弥合机器学习与高层推理之间的差距?
  • RQ3对训练好的模型实施哪些代数操作,可使系统回答其单个组件无法直接覆盖的新问题?
  • RQ4复杂推理任务在多大程度上可被分解为模块化学习与组合步骤?
  • RQ5简单模型组合与复杂推理机制(如概率或逻辑推理)之间是否存在概念上的连续性?

主要发现

  • 推理可被视为机器学习通过训练组件的代数组合的自然延伸,从而无需引入独立的推理层。
  • 将字符分割器、识别器和语言模型组合为单一系统,构成一种推理形式,因其回答了关于完整文本识别的新问题。
  • 对组合系统进行微调等价于在模型空间中执行一种代数操作,证明了通过模块化整合可实现推理。
  • 该方法在简单模型连接与复杂推理系统(如逻辑或概率推理)之间建立了概念上的连续性。
  • 该框架能够从现有的机器学习组件中逐步且系统性地构建推理能力。
  • 本文证明,推理并不需要架构的根本性转变,而可从对学习模型的更丰富操作中自然涌现。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。