[論文レビュー] MT-SNN: Enhance Spiking Neural Network with Multiple Thresholds
MT-SNNはMultiple Threshold (MT)機構をPLIFベースのスパイキングニューラルネットワークに導入し、同じ時間ステップ数で精度を向上させ、CIFAR-10/100および DVS-CIFAR10で fewer steps で高精度を実現します。
Spiking neural networks (SNNs) present a promising energy efficient alternative to traditional Artificial Neural Networks (ANNs) due to their multiplication-free operations enabled by binarized intermediate activations. However, this binarization leads to precision loss, hindering the SNN performance. In this paper, we introduce Multiple Threshold (MT) approaches to significantly enhance SNN accuracy by mitigating precision loss. We propose two distinct modes for MT implementation, depending on the membrane update rule: parallel mode and cascade mode. MT-SNN models can be efficiently trained on standard hardwares like GPUs and TPUs, while retaining the multiplication-free advantage crucial for deployment on neuromorphic devices. Our extensive experiments on CIFAR10, CIFAR100, ImageNet, and DVS-CIFAR10 datasets demonstrate that both MT modes substantially improve the performance of single-threshold SNNs, achieving higher accuracy with fewer time steps and comparable energy consumption. Moreover, MT-SNNs outperform state-of-the-art (SOTA) results. Notably, with MT, a Parametric-Leaky-Integrate-Fire (PLIF) based ResNet-34 architecture reaches 72.17\% accuracy on ImageNet with a single time step, surpassing the previous SOTA by 2.75\% despite using 4 steps.
研究の動機と目的
- スパイク活性化で浮動小数点値を0/1スパイクに置換する際の情報損失を動機づける。
- スパイク発火の際にある程度の精度を保持するためのMultiple Threshold (MT)拡張を提案する。
- MTの有効性をVGG-およびResNetベースのSNNsで静的データセット(CIFAR-10/100)およびニューロモルフィックデータセット(DVS-CIFAR10)で実証する。
- MTは同じステップ数でより高い精度を達成し、時間ステップを減らしてANNレベルの性能に匹敵または上回ることができることを示す。
提案手法
- PLIFニューロンの発火段階に対する拡張として複数の閾値を計算するMTを導入する:S[t]Δi = Θ(H[t] - Vth - Δi) for i = 1..n。
- 複数のスパイクセ StreamsをS[t]sum = S[t] + Σi S[t]Δiで結合し、Conv(S[t]sum) = Conv(S[t]) + Σi Conv(S[t]Δi)として畳み込みを伝播させ、乗算を用いない計算を保持する。
- 学習にはτ = 1 + exp(-a)を用いた学習可能な膜時間定数を持つPLIFニューロンと代理勾配を使用する。
- CIFAR-10/100およびDVS-CIFAR10で標準のバックプロパゲーションと代理勾配を用いてMT-VGG(VGG-8/9)およびMT-ResNet-20のアーキテクチャを訓練する。
実験結果
リサーチクエスチョン
- RQ1MTはST SNNと比較して固定時間ステップ数で分類精度を向上させるか。
- RQ2MTはより少ない時間ステップで同等または優れた精度を達成でき、訓練/推論の待機時間を短縮できるか。
- RQ3MTは静的画像データセット(CIFAR-10/100)とニューロモルフィックデータセット(DVS-CIFAR10)でどのように性能に影響するか。
- RQ4どのネットワーク要素(畳み込み vs 全結合)がMTの恩恵を最も受けるか。
主な発見
- MTはCIFAR-10およびCIFAR-100で、すべてのステップ1–5においてSTに対してVGG-8/9およびResNet-20の各アーキテクチャで精度を向上させる。
- MT対応のVGG-9は1ステップで92.47%(CIFAR-10)と73.67%(CIFAR-100)、5ステップで94.74% / 75.29%(CIFAR-10 / CIFAR-100)を達成し、いくつかの従来のSNN結果を上回る。
- MT-VGG-9およびMT-ResNet-20は、STベースラインよりも少ない時間ステップで最先端の結果に達するか上回ることができる。MT-VGG-9は2ステップで92.471%(CIFAR-10)および74.79%(CIFAR-100)を達成。
- DVS-CIFAR10ではMT-VGG-12が約76.3%の精度を達成し、同程度のステップでいくつかの従来手法を上回る。
- アブレーション研究は、全結合層にMTを適用すると早期ステップでの利得が得られ、正/負のデルタの混合と適切な大きさを組み合わせると最良の性能が得られることを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。