[論文レビュー] Brain-inspired Computational Intelligence via Predictive Coding
この論文は、学習と推論のバックプロパゲーションに代わる脳に着想を得た予測符号化(PC)を調査し、理論的基盤、実装、機械学習とAIシステムへの応用を概説します。
Artificial intelligence (AI) is rapidly becoming one of the key technologies of this century. The majority of results in AI thus far have been achieved using deep neural networks trained with a learning algorithm called error backpropagation, always considered biologically implausible. To this end, recent works have studied learning algorithms for deep neural networks inspired by the neurosciences. One such theory, called predictive coding (PC), has shown promising properties that make it potentially valuable for the machine learning community: it can model information processing in different areas of the brain, can be used in control and robotics, has a solid mathematical foundation in variational inference, and performs its computations asynchronously. Inspired by such properties, works that propose novel PC-like algorithms are starting to be present in multiple sub-fields of machine learning and AI at large. Here, we survey such efforts by first providing a broad overview of the history of PC to provide common ground for the understanding of the recent developments, then by describing current efforts and results, and concluding with a large discussion of possible implications and ways forward.
研究の動機と目的
- バックプロパゲーションに代わる堅牢で効率的な代替として予測符号化をAI研究で探究する動機付け。
- 階層ガウス生成モデルの変分自由エネルギー最小化としてPCを統一理論枠組みとして提示する。
- 三つの主要なPCフレームワーク(Rao–Ballard、Neural Generative Coding、Biased Competition with Divisive Modulation)とそれらの学習/推論ダイナミクスをレビューする。
- ローカリティ、堅牢性、および任意のトポロジーと連続状態生成モデルへの適合性におけるPCの利点を強調する。
提案手法
- PCを階層的生成モデルの反転として、変分自由エネルギー(ELBO)を最小化することによって定義する。
- 後部の事後分布の平均場因子分解とガウス近似を記述して局所的な予測誤差ベースの更新を導出する。
- PCエネルギー関数 E = 1/2 sum of squared prediction errors を提示し、値ノードとシナプスウェイトの局所更新規則を導出する。
- ラベルを最初と最後の層の状態をクランプして導入する方法を含め、PCにおける監視付きおよび無監視付き学習を説明する。
- 任意のトポロジーを扱うPCグラフによる一般的な配線を論じる。完全連結および疎結合構造を含む。
- Neural Generative Coding (NGC) および Biased Competition with Divisive Modulation (BC-DIM) のような変種と、それらが古典的PCとどのように異なるかを概説する。
実験結果
リサーチクエスチョン
- RQ1階層的生成モデルの反転/学習スキームとしての予測符号化の理論的基盤は何か。
- RQ2PC、NGC、BC-DIMはどのようにして局所的で生物学的に妥当な更新を、グローバルな自由エネルギー目的を最小化しつつ実装するか。
- RQ3任意のトポロジーを持つ監督付き・無監督付き学習タスクとスケーラブルなアーキテクチャへのPCの適用方法は。
- RQ4継続/オンラインまたはデータ不足の設定における従来のバックプロパゲーションに対するPCの堅牢性と学習利点は何か。
主な発見
- 変分自由エネルギーを最小化することという数学的根拠に基づく枠組みを提供し、局所的なニューロンレベルの予測誤差更新を含む。
- 特定条件下でPCの更新はバックプロパagationを近似でき、継続的・データ不足の学習で堅牢性の利点を持つ。
- NGCはより生物学的に妥当な配線パターンと神経ダイナミクスにPCを拡張し、側方競合と活性化リーケージを取り入れる。
- PCグラフは循環や脳様のアーキテクチャを含む任意に構造化されたネットワークで学習を可能にする。
- 監督付きPCアプローチは、エネルギーに基づく学習パラダイムで特定タスクにおいて深層ネットワークの性能に匹敵するか近づくことができる。
- PCは一部の設定で従来のバックプロップ学習済みネットワークと比較して堅牢性とキャリブレーションされた学習を改善することを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。