Skip to main content
QUICK REVIEW

[论文解读] Making Neural Programming Architectures Generalize via Recursion

Jonathon Cai, Richard Shin|arXiv (Cornell University)|Apr 21, 2017
Adversarial Robustness in Machine Learning被引用 80
一句话总结

这篇论文表明,将递归引入 Neural Programmer-Interpreter 架构能够在神经程序跨任务(如加法、冒泡排序、拓扑排序和快速排序)的可证明的完美泛化。用小型训练集进行了演示。

ABSTRACT

Empirically, neural networks that attempt to learn programs from data have exhibited poor generalizability. Moreover, it has traditionally been difficult to reason about the behavior of these models beyond a certain level of input complexity. In order to address these issues, we propose augmenting neural architectures with a key abstraction: recursion. As an application, we implement recursion in the Neural Programmer-Interpreter framework on four tasks: grade-school addition, bubble sort, topological sort, and quicksort. We demonstrate superior generalizability and interpretability with small amounts of training data. Recursion divides the problem into smaller pieces and drastically reduces the domain of each neural network component, making it tractable to prove guarantees about the overall system's behavior. Our experience suggests that in order for neural architectures to robustly learn program semantics, it is necessary to incorporate a concept like recursion.

研究动机与目标

  • 激励并解决从数据学习的神经程序的泛化能力差的问题。
  • 提出递归作为一个关键抽象,用以降低问题复杂度并使泛化证明可行。
  • 在 Neural Programmer-Interpreter 框架内展示跨多个任务的递归神经程序。

提出的方法

  • 引入 Neural Programmer-Interpreter 程序的递归形式,其中一个程序可以调用自身,返回地址处堆叠上下文。
  • 修改训练轨迹以包含显式的递归元素,使模型学习递归控制流。
  • 应用到四个任务(小学算术加法、冒泡排序、拓扑排序、快速排序),使用领域特定的编码器和环境表示。
  • 提供一个可验证的框架,在基例和归约规则正确时可实现可证明的完美泛化。

实验结果

研究问题

  • RQ1递归能否使神经程序对任意长度的输入或更复杂的实例实现完美泛化?
  • RQ2对于 NPI,需要哪些训练轨迹修改以学习递归程序?
  • RQ3在给定合适的基例和归约规则的情况下,递归神经程序是否存在可证明的泛化保证?
  • RQ4递归在加法、排序、拓扑排序和快速排序等任务中的学习与验证有何影响?

主要发现

  • 递归神经程序在所测试的任务上以较少的训练数据实现了完美泛化。
  • 递归轨迹使 NPI 更易学习递归程序,相较于非递归轨迹。
  • 当验证集覆盖所有基例和归约时,可实现可证明的完美泛化。
  • 递归减少了枚举所有输入的需求,通过关注子问题结构使验证可行。
  • 尾递归优化有助于管理递归程序中的调用栈增长。
  • 实验展示了在同一任务上相对于此前的泛化结果的性能改进。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。