[論文レビュー] A Backpropagation-Free Feedback-Hebbian Network for Continual Learning Dynamics
要約: 本論文は、連続学習プリミティブ(保持、忘却の解除、条件付け)を示すために、局所的ルール(中心化ヘブアン共分散、Oja正規化、局所監督付き)で厳密に局所的な学習を用いた最小限の前方二層・二戻り(two-forward, two-feedback)経路ネットワークを訓練し、逐次・交互学習の下で学習を可能にすることを示します。専用のフィードバックによってバックプロパゲーションなしで再生と同時維持が可能になることを示します。
Feedback-rich neural architectures can regenerate earlier representations and inject temporal context, making them a natural setting for strictly local synaptic plasticity. Existing literature raises doubt about whether a minimal, backpropagation-free feedback-Hebbian system can already express interpretable continual-learning-relevant behaviors under controlled training schedules. In this work, we introduce a compact prediction-reconstruction architecture with a dedicated feedback pathway providing lightweight, locally trainable temporal context for continual adaptation. All synapses are updated by a unified local rule combining centered Hebbian covariance, Oja-style stabilization, and a local supervised drive where targets are available. With a simple two-pair association task, learning is characterized through layer-wise activity snapshots, connectivity trajectories (row and column means of learned weights), and a normalized retention index across phases. Under sequential A to B training, forward output connectivity exhibits a long-term depression (LTD)-like suppression of the earlier association, while feedback connectivity preserves an A-related trace during acquisition of B. Under an alternating sequence, both associations are concurrently maintained rather than sequentially suppressed. Architectural controls and rule-term ablations isolate the role of dedicated feedback in regeneration and co-maintenance, alongside the role of the local supervised term in output selectivity and unlearning. Together, the results show that a compact feedback pathway trained with local plasticity can support regeneration and continual-learning-relevant dynamics in a minimal, mechanistically transparent setting.
研究の動機と目的
- 厳密に局所的な可塑性の下で、コンパクトなフィードバック–ヘブアン系が連続学習プリミティブを表現できるかを動機づけ・評価する。
- temporal contextのための専用フィードバック経路を持つ最小予測–再構成アーキテクチャを導入する。
- ウェイト伝送やグローバル誤差なしに、前方予測とフィードバック再構成のための統一局所学習ルールを提供する。
- 制御されたプロトコルの下で層ごとの活動、重みの軌跡、保持指標で学習ダイナミクスを特徴づける。
提案手法
- 予測出力のための二層前方経路(2つの10×10層)。
- 過去の活動を再構成し、時系列コンテキストとして加法的に注入する二つの専用フィードバック層(2つの10×10層)。
- 学習済み行列全体に適用される単一の局所可塑性ルール:Δw = lr[(x−⟨x⟩)(y−⟨y⟩) − β(y−⟨y⟩)^2 w + (t−y)x]、活動の中心化、Oja正規化、ターゲットが利用可能な場合の局所監督項。
- 活性化関数 φ(z) = 1/2(1 + tanh(z)) で活性化を0〜1に制限。
- 逐次的な A→B(Phase 1:A, Phase 2:B)および interleaved A/B 条件付けをテストする訓練 regime、相位ごとの接続分析。
実験結果
リサーチクエスチョン
- RQ1バックプロパゲーションなしで局所的に訓練されたフィードバック–ヘブアンネットワークが解釈可能な連続学習プリミティブを表現できるか?
- RQ2前方予測とフィードバック再構成は、異なる訓練スケジュール下で保持・忘却・条件付けをどのように相互作用して生み出すか?
- RQ3更新項(共分散、Oja正規化、局所監督)の役割は、これらのプリミティブを有効化・制約する上でどのように働くか?
- RQ4浅い2FF+2FBアーキテクチャは観測されたダイナミクスに十分か? アーキテクチャの切り離しで何が起きるか?
主な発見
| Update variant | Max |W| | Layer of max |
|---|---|---|
| Proposed (full rule) | 1.16 | Forward layer 1 |
| No decay (no Oja term) | 1.72 | Forward layer 1 |
| No covariance term | 1.99 | Forward layer 2 |
| No supervised term | 0.54 | Forward layer 1 |
- 逐次的な A→B 訓練の下で、前方出力の結合性は B に移行し、A に関連する前方ターゲットは抑制される(LTD様の忘却)。
- フィードバック層の結合性は、B の獲得中に A に関連する痕跡を保持し、フィードバック経路で保持を示す。
- A/B 交互シーケンスの下で、前方出力とフィードバック層の両方の関連付けが同時に維持され、時間的交互による条件付けを示す。
- フィードバック経路を除去すると再生が消失し、同時条件付けも困難になり、これらのダイナミクスには専用のフィードバックが不可欠であることを示す。
- ルール項の切り替え実験では、監督が出力選択性と LTD様の忘却に必須であること、共分散と Oja 項は重みのスケールと安定性を調整することが示される。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。