Skip to main content
QUICK REVIEW

[論文レビュー] Automatically Composing Representation Transformations as a Means for Generalization

Michael B. Chang, Abhishek Gupta|arXiv (Cornell University)|Jul 12, 2018
Topic Modeling参考文献 94被引用数 24
ひとこと要約

この論文では、複雑な問題を、以前の部分問題への類推による推論によって解決するために、再利用可能な表現変換を自動的に構成するドメインに依存しないフレームワーク、組成的再帰的学習者(CRL)を紹介する。CRLは、スパarsely supervisedおよびカリキュラム学習を通じてモジュラーで階層的な計算を学習することにより、訓練中に見られなかったより長く複雑な問題に対して強力なゼロショット一般化を達成し、記号的算術およびビジョンタスクにおいて非組成的ベースラインを上回る性能を発揮する。

ABSTRACT

A generally intelligent learner should generalize to more complex tasks than it has previously encountered, but the two common paradigms in machine learning -- either training a separate learner per task or training a single learner for all tasks -- both have difficulty with such generalization because they do not leverage the compositional structure of the task distribution. This paper introduces the compositional problem graph as a broadly applicable formalism to relate tasks of different complexity in terms of problems with shared subproblems. We propose the compositional generalization problem for measuring how readily old knowledge can be reused and hence built upon. As a first step for tackling compositional generalization, we introduce the compositional recursive learner, a domain-general framework for learning algorithmic procedures for composing representation transformations, producing a learner that reasons about what computation to execute by making analogies to previously seen problems. We show on a symbolic and a high-dimensional domain that our compositional approach can generalize to more complex problems than the learner has previously encountered, whereas baselines that are not explicitly compositional do not.

研究の動機と目的

  • 以前に見たことのないより複雑なタスクに一般化する挑戦に取り組むこと、特に先行する解決策が直接適用できない場合に焦点を当てる。
  • コンポジショナル問題グラフを用いてタスク間でコンポジショナル構造を形式化し、部分解の再利用を可能にする。
  • 再利用可能な変換モジュールを自動で発見・組成するドメインに依存しない学習フレームワークを開発すること。
  • 類推による推論を通じて、以前に学習した変換をメタリーダムに再利用し、新しいより複雑な問題を解くこと。
  • コンポジショナル一般化をベンチマークとして用い、訓練分布を超えた一般化を評価すること。

提案手法

  • CRLは、各変換がモジュラーな計算ユニットである表現変換の上でのアルゴリズム的手順の学習として問題解決を定式化する。
  • フレームワークは、メタレベルのマルコフ決定過程(MDP)において、段階的にモジュールを適用するコントローラーを用いる。
  • モジュールはスパースな監視と局所的なタスクビューにより訓練され、タスクに依存しない再利用可能な機能を促進する。
  • カリキュラム学習のスキームにより、モデルは徐々に複雑な問題にさらされ、既知の部分解の再利用を促進する。
  • コントローラーは深層強化学習を用いて最適な組成ポリシーを学習し、再帰的およびループに類似した振る舞いを可能にする。
  • 表現変換はエンドツーエンドで学習され、繰り返しモジュールを適用することで、入力をより馴染みやすい形に再表現する。

実験結果

リサーチクエスチョン

  • RQ1訓練中に見られなかったが、以前に学習した部分解を組み合わせることで、より複雑な問題に一般化できるか?
  • RQ2問題分布におけるコンポジショナル構造は、モノリシックまたはタスク固有のモデルと比較して、どのようにより良い一般化を可能にするか?
  • RQ3構成順序に関する明示的監視がなくとも、モデルは類推による推論と変換の組成をどの程度学習できるか?
  • RQ4メタリーダムコントローラーは自己教師あり学習を通じて、未知の問題を既知の部分問題に分解する能力を学習できるか?
  • RQ5このアプローチは、顕著に長いまたはより複雑な問題への外挿に対して、どの程度頑健であるか?

主な発見

  • 多言語算術問題において、CRLは2~5項の問題で訓練した後、100項の問題で60%の精度を達成し、ランダム推測の10%のベースラインを大きく上回った。
  • MNIST空間変換タスクにおいて、CRLは訓練時に見られなかったより複雑な空間的摂動に対しても一般化し、分布シフトに対して頑健であることを示した。
  • 実行トレースから、CRLが翻訳モジュールと算術解決モジュールを、たとえば答えをターゲット言語に翻訳するような新しい方法で組み合わせていることが観察された。
  • モデルは、厳密な順序に従わなくても、順序の法則を柔軟に適用し、正しく結果に到達していた。
  • CRLは顕著な外挿能力を示し、10項から20項の算術式への外挿においても約80%の精度を維持した。
  • フレームワークはモジュール数の変化に対して頑健であり、さまざまなアーキテクチャ設定において安定した性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。