Skip to main content
QUICK REVIEW

[論文レビュー] How Auto-Encoders Could Provide Credit Assignment in Deep Networks via Target Propagation

Yoshua Bengio|arXiv (Cornell University)|Jul 29, 2014
Generative Adversarial Networks and Image Synthesis参考文献 52被引用数 119
ひとこと要約

この論文では、勾配に依存しない再構成信号を学習することで、バックプロパゲーションに代わる自己符号化器を用いたターゲット伝播を提案している。深層自己符号化器を用いて符号化表現から入力を再構成することで、局所的な訓練信号を介した生物学的に妥当な信用配分メカニズムを提供し、非線形性や離散ユニットを含む深層ネットワークの学習を可能にする。

ABSTRACT

We propose to exploit {\em reconstruction} as a layer-local training signal for deep learning. Reconstructions can be propagated in a form of target propagation playing a role similar to back-propagation but helping to reduce the reliance on derivatives in order to perform credit assignment across many levels of possibly strong non-linearities (which is difficult for back-propagation). A regularized auto-encoder tends produce a reconstruction that is a more likely version of its input, i.e., a small move in the direction of higher likelihood. By generalizing gradients, target propagation may also allow to train deep networks with discrete hidden units. If the auto-encoder takes both a representation of input and target (or of any side information) in input, then its reconstruction of input representation provides a target towards a representation that is more likely, conditioned on all the side information. A deep auto-encoder decoding path generalizes gradient propagation in a learned way that can could thus handle not just infinitesimal changes but larger, discrete changes, hopefully allowing credit assignment through a long chain of non-linear operations. In addition to each layer being a good auto-encoder, the encoder also learns to please the upper layers by transforming the data into a space where it is easier to model by them, flattening manifolds and disentangling factors. The motivations and theoretical justifications for this approach are laid down in this paper, along with conjectures that will have to be verified either mathematically or experimentally, including a hypothesis stating that such auto-encoder mediated target propagation could play in brains the role of credit assignment through many non-linear, noisy and discrete transformations.

研究の動機と目的

  • 深層学習における深く非線形的かつ、場合によっては離散的表現の間での信用配分の課題に対処すること。
  • 強い非線形性を示す深層または再帰的ネットワークにおけるバックプロパゲーションの制限を軽減すること。
  • 自己符号化器が深層アーキテクチャにおける勾配計算の学習済み局所的代理手段として機能しうるかを検討すること。
  • 再構成をターゲットとして用いることでバックプロパゲーションを一般化するフレームワークを提案し、離散的隠れユニットを含む学習を可能にすること。
  • このメカニズムが、脳における信用配分のモデルとして生物学的に妥当であるかを検証すること。

提案手法

  • 各層が上位層の表現から入力を再構成できる深層自己符号化器アーキテクチャを用い、入力および補助情報(例:ラベル)を自己符号化器の入力として使用する。
  • 再構成が入力のより高い尤度のバージョンになるように自己符号化器を学習させ、これは勾配降下の一般化としての小さな尤度上昇に対応する。
  • 自己符号化器の復元パスを学習済み非線形勾配フローの一般化として用い、再構成ターゲットをネットワークを逆向きに伝播させることでターゲット伝播を実行する。
  • ターゲット伝播により勾配を一般化し、非無限小の変化や離散的変換に対応させ、離散的隠れユニットを含むネットワークの学習を可能にする。
  • エンコーダーを用いてデータを、上位層がより容易にモデル化できる空間に変換し、多様体を平坦化し、変動要因を分離する。
  • 正則化を導入し、必要に応じてノイズまたは欠損入力を用いて、耐性を高め、欠損モダリティに対処する。

実験結果

リサーチクエスチョン

  • RQ1自己符号化器の再構成は、深層ネットワークにおける信用配分の有効な学習済みターゲットとして機能するか?
  • RQ2自己符号化器によるターゲット伝播は、バックプロパゲーションが失敗する強力な非線形性や離散的隠れユニットに対応できるか?
  • RQ3この手法は、脳における信用配分の生物学的に妥当なメカニズムを提供するか?
  • RQ4このアプローチは、無限小の変化を超えてバックプロパゲーションを一般化し、長大な非線形演算の連鎖を経て学習可能にするか?
  • RQ5この手法は、曖昧な事後分布、欠損モダリティ、または時間的依存性を扱うためにどのように拡張できるか?

主な発見

  • 提案された自己符号化器を介したターゲット伝播は、学習済み非線形な方法で勾配伝播を一般化し、深く非線形的かつ離散的変換を経る信用配分を可能にする可能性がある。
  • 再構成信号を局所的に計算・伝播させることでバックプロパゲーションへの依存を軽減し、消失/爆発勾配問題の解決策となる可能性を提供する。
  • エンコーダーは上位層がより容易にモデル化できる表現を学習し、多様体の平坦化と変動要因の分離を促進する。
  • 補助情報(例:ラベル)を用いて再構成をガイドできる条件付き自己符号化器をサポートし、構造的データのモデリングを改善する。
  • 再構成が勾配計算の代理として機能しうることに理論的根拠があり、生物学的神経回路への関連性も示唆される。
  • ノイズ注入、モダリティ、再帰的ネットワーク、時間的ダイナミクスに関する未解決の課題を同定し、今後の実験的および理論的検証の方向性を示唆する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。