QUICK REVIEW

[论文解读] Differentiable Programs with Neural Libraries

Alexander L. Gaunt, Marc Brockschmidt|arXiv (Cornell University)|Nov 7, 2016

Neural Networks and Applications被引用 31

一句话总结

本文提出了神经可解释框架（Neural TerpreT, NTPT），该框架将可微编程与神经网络相结合，构建出可解释、模块化的模型，能够从输入-输出示例中实现持续学习。通过将解决方案结构化为调用可训练神经组件的可执行源代码，该系统在感知编程示例任务中实现了强大的泛化能力与对先前任务的持续改进，且不会出现灾难性遗忘，其表现优于纯神经网络基线模型。

ABSTRACT

We develop a framework for combining differentiable programming languages with neural networks. Using this framework we create end-to-end trainable systems that learn to write interpretable algorithms with perceptual components. We explore the benefits of inductive biases for strong generalization and modularity that come from the program-like structure of our models. In particular, modularity allows us to learn a library of (neural) functions which grows and improves as more tasks are solved. Empirically, we show that this leads to lifelong learning systems that transfer knowledge to new tasks more effectively than baselines.

研究动机与目标

为解决在弱监督（输入-输出对）条件下，感知编程示例（PPBE）中的持续学习挑战，其中模型需在涉及图像或文本的多样化任务中实现泛化。
开发一种混合架构，结合可解释的程序结构与可训练的神经组件，以实现任务间的模块化与知识共享。
通过允许在引入新任务后仍能提升早期任务的性能，克服持续学习中的灾难性遗忘问题。
探索程序式归纳偏置（如控制流与模块化）如何增强神经系统中的泛化能力与可解释性。
证明端到端可微训练源代码与神经组件可实现具备可迁移知识的有效持续学习。

提出的方法

该框架使用可微解释器作为控制器，执行包含对神经网络函数调用的源代码，从而实现代码与神经参数的联合优化。
神经组件通过反向传播进行端到端训练，梯度通过解释器流动，以同时更新程序逻辑与神经权重。
随着新任务的解决，神经函数库被动态扩展与优化，从而实现任务间的知识迁移。
通过允许解释器选择性调用或忽略神经组件，强制实现模块化，有助于防止干扰并支持持续学习。
系统在持续学习设置下运行，早期任务不再被重新遇到，但性能随时间推移而提升，归因于共享组件的更新。
该方法利用源代码结构作为归纳偏置，倾向于生成可泛化的解决方案，例如可泛化至任意输入长度的循环。

实验结果

研究问题

RQ1结合可微编程与神经网络的混合模型，是否能在感知编程任务中实现优于纯神经网络模型的泛化能力与持续学习性能？
RQ2程序结构中的模块化如何影响持续学习中的知识迁移能力与对灾难性遗忘的抵抗能力？
RQ3在不再直接训练先前学习任务后，其性能在多大程度上仍能通过共享神经组件的更新而提升？
RQ4使用源代码作为表示形式是否施加了归纳偏置，从而倾向于生成具有强泛化特性的解决方案？
RQ5系统是否能仅通过弱监督（输入-输出示例）学习编写可解释、可重用的算法，且包含感知组件？

主要发现

即使在不再直接训练早期任务后，系统仍表现出对这些任务的持续改进，表明实现了有效的持续学习并避免了灾难性遗忘。
随着新任务的学习，早期任务的性能因神经函数库的共享更新而提升，显示出有效的知识迁移。
源代码的模块化结构允许选择性使用神经组件，这可能解释了模型对遗忘的抵抗能力，通过隔离无关组件实现。
在迁移学习与泛化方面，该混合模型优于纯神经网络基线，尤其在需要对图像或文本等感知输入进行推理的任务中表现更优。
源代码表示支持可解释且可人工验证的解决方案，有利于领域知识的整合与反馈循环。
该框架成功诱导出具有强泛化能力的程序，例如可泛化至任意列表长度的循环，即使在仅用短样本训练的情况下亦能实现。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。