QUICK REVIEW

[論文レビュー] Bio-Inspired Digit Recognition Using Spike-Timing-Dependent Plasticity (STDP) and Reward-Modulated STDP in Deep Convolutional Networks

Milad Mozafari, ‎Mohammad Ganjtabesh|arXiv (Cornell University)|Mar 31, 2018

Advanced Memory and Neural Computing被引用数 5

ひとこと要約

本稿では、下層でスパイク到達時間依存可塑性（STDP）を、上層で報酬調整STDP（R-STDP）を用いる生物学的インスピレーションを受けて設計された深層畳み込みスパイクニューラルネットワーク（DCSNN）を提案する。この手法により、バックプロパゲーションを不要としつつ、エネルギー効率の高い数字認識が可能になる。MNISTデータセットで97.2%の精度を達成し、不要な特徴を除外しながらタスクに特化した特徴を学習する。生物学的に妥当かつハードウェアに適したソリューションを提供する。

ABSTRACT

The primate visual system has inspired the development of deep artificial neural networks, which have revolutionized the computer vision domain. Yet these networks are much less energy-efficient than their biological counterparts, and they are typically trained with backpropagation, which is extremely data-hungry. To address these limitations, we used a deep convolutional spiking neural network (DCSNN) and a latency-coding scheme. We trained it using a combination of spike-timing-dependent plasticity (STDP) for the lower layers and reward-modulated STDP (R-STDP) for the higher ones. In short, with R-STDP a correct (resp. incorrect) decision leads to STDP (resp. anti-STDP). This approach led to an accuracy of $97.2\%$ on MNIST, without requiring an external classifier. In addition, we demonstrated that R-STDP extracts features that are diagnostic for the task at hand, and discards the other ones, whereas STDP extracts any feature that repeats. Finally, our approach is biologically plausible, hardware friendly, and energy-efficient.

研究の動機と目的

コンピュータビジョンにおける深層学習におけるバックプロパゲーションの代替手段として、生物学的に妥当でエネルギー効率の高い手法を開発すること。
時間的符号化を用いたスパイクニューラルネットワーク（SNN）を活用することで、従来の深層ネットワークの高いデータおよびエネルギー消費を低減すること。
外部分類器やバックプロパゲーションを一切用いずに、エンドツーエンドの深層SNNの訓練を可能にすること。
R-STDPがタスクに必要な特徴を抽出し、不要な特徴を除外するメカニズムを解明すること。
神経形状ハードウェアへの適合性とエネルギー効率を、生物学的インスピレーションを受けて設計された可塑性ルールで訓練されたスパイクニューラルネットワークにおいて実証すること。

提案手法

入力データを時間的パターンとして表現するため、遅延符号化を用いた深層畳み込みスパイクニューラルネットワーク（DCSNN）を採用した。
下層では、入力パターンからの繰り返し時間的特徴を学習するために、標準的なスパイク到達時間依存可塑性（STDP）を適用した。
上層では、正しい意思決定がSTDPを強化し、誤った意思決定が逆転STDPを引き起こす報酬調整STDP（R-STDP）を用いた。
R-STDPを、タスクレベルのフィードバックに基づいてシナプスの重みを調整する信用割り当てメカニズムとして統合し、バックプロパゲーションの必要性を排除した。
局所的でオンラインかつ生物学的に妥当な学習ルールのみを用いて、エンドツーエンドの訓練を実現した。
イベントベースの計算とスパースで時間的な符号化を活用することで、神経形状ハードウェアに適合したアーキテクチャを設計した。

実験結果

リサーチクエスチョン

RQ1STDPとR-STDPを用いて訓練された深層スパイクニューラルネットワークは、バックプロパゲーションを一切用いずに、MNISTのような標準的なビジョンベンチマークで高い精度を達成できるか？
RQ2タスクの関連性という観点から、R-STDPは標準的なSTDPとどのように異なるか？
RQ3R-STDPは、情報のないまたは冗長な特徴をどれだけ効果的に除外しながら、診断に有用な特徴を学習できるか？
RQ4提案された訓練方式は生物学的に妥当であり、神経形状ハードウェアへの実装に適しているか？
RQ5階層的アーキテクチャにおいてSTDPとR-STDPを組み合わせることで、標準的な深層ネットワークと同等の性能を達成しつつ、よりエネルギー効率の高い性能が得られるか？

主な発見

提案されたDCSNNは、下層でSTDP、上層でR-STDPを用いるだけで、外部分類器やバックプロパゲーションを一切用いずに、MNISTデータセットで97.2%のテスト精度を達成した。
R-STDPは、分類タスクに有用な特徴を効果的に抽出し、関連のないまたは冗長な特徴をフィルタリングするのに成功した。
STDPとは異なり、タスクの関連性にかかわらず繰り返し時間パターンを学習するのではなく、R-STDPは正しい意思決定に寄与するシナプスのみを特に対象として強化する。
スパースでイベントベースの計算と生物学的に妥当な学習ルールの使用により、ネットワークは顕著なエネルギー効率を示した。
アーキテクチャは神経形状ハードウェアと互換性があり、低消費電力でリアルタイムの推論と学習が可能である。
R-STDPが、教師あり学習タスクにおける深層SNNにおいて、効果的で局所的かつ信用割り当てが可能な学習ルールとして機能できることを実証した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。