QUICK REVIEW

[論文レビュー] Early Inference in Energy-Based Models Approximates Back-Propagation

Yoshua Bengio, Asja Fischer|arXiv (Cornell University)|Oct 9, 2015

Neural dynamics and brain function参考文献 17被引用数 19

ひとこと要約

この論文は、潜在変数を有する連続的エネルギーに基づくモデルにおける初期推論ステップが、誤差勾配伝播による誤差逆伝播法を近似することを提案している。ラングヴィンMCMCダイナミクスを用いて、外部入力からの摂動が隠れユニットにおいて勾配に類似した更新を引き起こすことを示し、深層ネットワークにおける信用配分の生物学的に妥当なメカニズムを示唆している。

ABSTRACT

We show that Langevin MCMC inference in an energy-based model with latent variables has the property that the early steps of inference, starting from a stationary point, correspond to propagating error gradients into internal layers, similarly to back-propagation. The error that is back-propagated is with respect to visible units that have received an outside driving force pushing them away from the stationary point. Back-propagated error gradients correspond to temporal derivatives of the activation of hidden units. This observation could be an element of a theory for explaining how brains perform credit assignment in deep hierarchies as efficiently as back-propagation does. In this theory, the continuous-valued latent variables correspond to averaged voltage potential (across time, spikes, and possibly neurons in the same minicolumn), and neural computation corresponds to approximate inference and error back-propagation at the same time.

研究の動機と目的

連続的潜在変数を有するエネルギーに基づくモデルにおける初期推論ステップが、誤差逆伝播法を模倣するかどうかを調査すること。
脳に類似したシステムにおける神経計算が、明示的な誤差逆伝播法なしに、効率的な信用配分をどのように行うかを探索すること。
確率的推論ダイナミクス（ラングヴィンMCMC）と深層ネットワークにおける勾配ベースの学習を結びつけること。
連続的値をとる潜在変数とノイズ駆動ダイナミクスを用いて、深層階層における生物学的に妥当な信用配分のメカニズムを提案すること。
シナプス可塑性ルール（例：STDP）とエネルギーに基づくモデルにおける確率的勾配更新との間の潜在的関連を検討すること。

提案手法

神経系を可視ユニットと隠れユニットを有する連続的エネルギーに基づくモデルとしてモデル化し、エネルギー関数がシステムのダイナミクスを定義する。
追加のノイズを有する漏れ統合器ニューロンモデルを用いて生物学的神経ダイナミクスを模倣し、ラングヴィンMCMC推論を近似する。
隠れユニットの時間発展をエネルギー関数の勾配降下として導出し、可視ユニットからのノイズ駆動摂動を含む。
隠れユニット活性化の時間微分を分析し、外部駆動下で誤差勾配を逆伝播したものと数学的に一致することを示す。
推論プロセスを変分推論とEMに類似た最適化と結びつけ、モデルパラメータを観測データをよりよく説明できるように更新する。
STDPに類似したルールに従うシナプス更新が、予測誤差に関する確率的勾配降下を近似できることを提唱する。

実験結果

リサーチクエスチョン

RQ1エネルギーに基づくモデルにおける初期推論ステップが、深層学習で用いられる誤差逆伝播法を近似できるか？
RQ2外部入力からの摂動が、連続的かつノイズ駆動の神経系における隠れ層をどのように伝播するか？
RQ3隠れユニット活性化の時間微分と逆伝播された誤差勾配との数学的関係は何か？
RQ4STDPに類似したシナプス可塑性ルールが、自然にこのようなモデルにおける確率的勾配降下学習に近似することができるか？
RQ5エネルギーに基づくモデルにおける対称的重み制約が、生物学的に妥当な方法で学習ダイナミクスからどのように生じるか？

主な発見

連続的エネルギーに基づくモデルにおけるラングヴィンMCMCダイナミクスの初期推論ステップは、隠れユニットにおいて誤差逆伝播された誤差に対応する勾配に類似した更新を生じる。
外部駆動下における隠れユニット活性化の時間微分は、数学的にネットワークを逆方向に伝播された誤差勾配と一致する。
ノイズを伴う漏れ統合器を用いた神経計算が、ラングヴィンMCMCを実行することで、同時に近似的な推論と誤差逆伝播を実行する。
システムのダイナミクスは、モデルパラメータが観測データをよりよく説明できるように更新されるという変分推論の目的と自然に一致する。
STDPに類似したルールに従うシナプス更新は、予測誤差に関する確率的勾配降下を近似でき、生物学的に妥当な学習メカニズムを示唆する。
自己符号化器に類似した目的関数において、対称的重みが自然に出現し、生物学的シナプスの位置の非対称性にもかかわらず、エネルギーに基づくモデルにおける対称的接続の妥当性を支持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。