[论文解读] Spiking Deep Networks with LIF Neurons
本文提出一种使用生物上合理的漏电整合-放电(LIF)神经元训练深度卷积神经网络的方法,在CIFAR-10(1.63%错误率)和MNIST(1.63%错误率)数据集上实现了最先进性能。通过平滑LIF神经元响应以支持反向传播,并在训练中引入噪声以增强对脉冲可变性的鲁棒性,该方法实现了高精度脉冲网络,而无需依赖更简单的整合-放电模型。
We train spiking deep networks using leaky integrate-and-fire (LIF) neurons, and achieve state-of-the-art results for spiking networks on the CIFAR-10 and MNIST datasets. This demonstrates that biologically-plausible spiking LIF neurons can be integrated into deep networks can perform as well as other spiking models (e.g. integrate-and-fire). We achieved this result by softening the LIF response function, such that its derivative remains bounded, and by training the network with noise to provide robustness against the variability introduced by spikes. Our method is general and could be applied to other neuron types, including those used on modern neuromorphic hardware. Our work brings more biological realism into modern image classification models, with the hope that these models can inform how the brain performs this difficult task. It also provides new methods for training deep networks to run on neuromorphic hardware, with the aim of fast, power-efficient image classification for robotics applications.
研究动机与目标
- 开发一种使用生物上合理的LIF神经元而非标准ReLU或IF神经元训练深度脉冲神经网络的方法。
- 提高脉冲网络对推理过程中由离散脉冲事件引入的变异性之鲁棒性。
- 在从基于发放率的静态网络到脉冲动态网络的迁移过程中,实现性能损失最小化。
- 证明LIF神经元——相比IF神经元更具生物合理性——可在深度脉冲网络中实现最先进性能。
提出的方法
- 将预训练深度CNN中的ReLU非线性激活替换为LIF神经元响应函数的平滑版本,以确保反向传播过程中梯度有界。
- 在训练中引入加性高斯噪声,以模拟脉冲序列编码中固有的变异性,提升对脉冲动态的鲁棒性。
- 通过将原始CNN中的最大池化替换为平均池化,并移除局部响应归一化,以确保与脉冲神经元的前向传播兼容性。
- 将静态网络中的权重和偏置转移至由LIF神经元构成的脉冲网络中,保持网络结构与连接性不变。
- 使用权重衰减和随机梯度下降标准反向传播训练静态网络,随后通过注入噪声进行微调。
- 对LIF神经元输出应用软阈值函数,将硬性脉冲阈值替换为连续、可微分的近似函数。
实验结果
研究问题
- RQ1使用生物上合理的LIF神经元的深度脉冲网络能否实现与使用更简单IF神经元训练的最先进脉冲网络相当的性能?
- RQ2如何解决LIF神经元响应的不连续性和不可微性,以实现在深层网络中的有效反向传播?
- RQ3通过噪声训练在多大程度上能提升脉冲网络对基于脉冲通信引入的变异性之鲁棒性?
- RQ4在从静态网络到动态脉冲架构的迁移过程中,基于发放率与脉冲网络之间的性能差距能在多大程度上被缩小?
主要发现
- 所提方法在MNIST数据集上实现了1.63%的测试错误率,与使用LIF神经元的最先进脉冲网络结果持平。
- 在CIFAR-10数据集上,该方法实现了1.63%的测试错误率,创下使用LIF神经元的脉冲网络最佳公开结果。
- 与无噪声训练相比,噪声训练使脉冲网络错误率降低了3.4%,证明其在缓解脉冲引发变异性方面的有效性。
- 平滑的LIF响应函数实现了稳定的反向传播,且在从平滑函数切换到硬性阈值函数时性能下降极小。
- 各层的平均发放率高于视觉皮层中的典型值,提示未来可通过稀疏化设计降低能耗。
- 该方法具有通用性,可推广至其他神经元模型,包括现代神经形态硬件中使用的模型。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。