QUICK REVIEW

[論文レビュー] Making Neural Programming Architectures Generalize via Recursion

Jonathon Cai, Richard Shin|arXiv (Cornell University)|Apr 21, 2017

Adversarial Robustness in Machine Learning被引用数 80

ひとこと要約

本論文は、Neural Programmer-Interpreter アーキテクチャに再帰を組み込むことで、加算、バブルソート、トポロジカルソート、クイックソートなどのタスクに対するニューラルプログラムの証明可能な完全一般化を実現することを示しており、少数の訓練データセットで実証されている。

ABSTRACT

Empirically, neural networks that attempt to learn programs from data have exhibited poor generalizability. Moreover, it has traditionally been difficult to reason about the behavior of these models beyond a certain level of input complexity. In order to address these issues, we propose augmenting neural architectures with a key abstraction: recursion. As an application, we implement recursion in the Neural Programmer-Interpreter framework on four tasks: grade-school addition, bubble sort, topological sort, and quicksort. We demonstrate superior generalizability and interpretability with small amounts of training data. Recursion divides the problem into smaller pieces and drastically reduces the domain of each neural network component, making it tractable to prove guarantees about the overall system's behavior. Our experience suggests that in order for neural architectures to robustly learn program semantics, it is necessary to incorporate a concept like recursion.

研究の動機と目的

データから学習されたニューラルプログラムの一般化不足を動機づけ、対処する。
問題の複雑性を低減し、解決可能な一般化証明を可能にする主要な抽象化として再帰を提案する。
複数のタスクにわたって Neural Programmer-Interpreter フレームワーク内で再帰的ニューラルプログラムを示す。

提案手法

プログラムが自分自身を呼び出すことができ、戻りアドレスにコンテキストが積み重ねられる、Neural Programmer-Interpreter プログラムの再帰的定式化を導入する。
トレーニングトレースを、モデルが再帰的制御フローを学習できるよう、明示的な再帰要素を含むように変更する。
4つのタスク（grade-school addition、bubble sort、topological sort、quicksort）に、ドメイン固有のエンコーダと環境表現を用いて適用する。
基底ケースと約化規則が正しければ、検証可能な完全一般化が達成されることを保証するフレームワークを提供する。

実験結果

リサーチクエスチョン

RQ1再帰はニューラルプログラムを任意に長い入力やより複雑なインスタンスに対して完全に一般化させることができるか？
RQ2NPIが再帰的なプログラムを学習するためには、どのようなトレースの変更が必要か？
RQ3適切な基底ケースと約化規則が与えられた場合、再帰的ニューラルプログラムの一般化に関する証明可能な保証は存在するか？
RQ4加算、ソート、トポロジカルソート、クイックソートといったタスクにおいて、再帰は学習と検証にどのような影響を与えるか？

主な発見

再帰的ニューラルプログラムは、少量の訓練データで検証されたタスクにおいて完全一般化を達成する。
再帰トレースは、非再帰トレースよりもNPIが再帰的プログラムを学習するのを容易にする。
検証セットがすべての基底ケースと約化を網羅する場合、証明可能な完全一般化が達成可能である。
再帰はすべての入力を列挙する必要を減らし、サブ問題の構造に焦点を当てることで検証を実現可能にする。
末尾再帰最適化は再帰プログラムにおけるコールスタックの成長を管理するのに役立つ。
実験は同じタスクに対する以前の一般化結果よりもパフォーマンスの改善を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。