Skip to main content
QUICK REVIEW

[论文解读] STDP as presynaptic activity times rate of change of postsynaptic activity

Yoshua Bengio, Thomas Mesnard|arXiv (Cornell University)|Sep 19, 2015
Advanced Memory and Neural Computing参考文献 16被引用 30
一句话总结

本文提出了一种新颖的突触可塑性规则,其中权重更新取决于突触前放电率与突触后活动时间导数的乘积,而非精确的尖峰时间。该规则再现了实验观察到的STDP样权重变化,并对应于对预测误差的随机梯度下降,为基于速率的动力学与深度网络中的反向传播之间提供了生物学上合理的联系。

ABSTRACT

We introduce a weight update formula that is expressed only in terms of firing rates and their derivatives and that results in changes consistent with those associated with spike-timing dependent plasticity (STDP) rules and biological observations, even though the explicit timing of spikes is not needed. The new rule changes a synaptic weight in proportion to the product of the presynaptic firing rate and the temporal rate of change of activity on the postsynaptic side. These quantities are interesting for studying theoretical explanation for synaptic changes from a machine learning perspective. In particular, if neural dynamics moved neural activity towards reducing some objective function, then this STDP rule would correspond to stochastic gradient descent on that objective function.

研究动机与目标

  • 开发一种无需显式尖峰时间即可解释STDP的突触可塑性规则,仅依赖放电率及其导数。
  • 通过证明其与随机梯度下降的等价性,弥合生物可塑性学习规则与基于反向传播的深度学习之间的鸿沟。
  • 为该规则在具有隐藏层的神经网络中可能支持学习提供理论与仿真依据。
  • 探讨突触后活动的时间导数是否可作为多层网络中信用分配的代理。

提出的方法

  • 权重更新规则定义为与突触前放电率和突触后活动时间导数的乘积成正比。
  • 非线性激活函数 ρ 将整合膜电位映射为放电率,从而实现基于速率的建模。
  • 该规则源于神经动力学最小化预测误差的假设,从而导致对误差的梯度下降。
  • 仿真结果表明,该规则再现了典型的STDP曲线:当突触后尖峰出现在突触前尖峰之后时发生长时程增强,反之则发生长时程抑制。
  • 与赫布规则相比,该方法通过引入突触后活动的变化率而非其水平来实现改进。
  • 理论分析表明,若神经活动演化以最小化目标函数,则该规则可对这一函数执行随机梯度下降。

实验结果

研究问题

  • RQ1是否可基于仅放电率及其导数的突触可塑性规则再现实验观察到的STDP模式?
  • RQ2基于突触前活动与突触后活动导数乘积的规则是否对应于对预测误差的随机梯度下降?
  • RQ3与Xie和Seung(2000)提出的现有基于速率的学习规则相比,该规则在生物合理性与学习性能方面有何差异?
  • RQ4该规则是否可在无需显式反向传播的情况下,支持具有隐藏层的深度网络中的信用分配?
  • RQ5若学习规则仅依赖于放电率及其导数,尖峰时间在此起什么作用?

主要发现

  • 所提出的规则成功再现了典型的STDP权重变化曲线,表现为突触后尖峰在突触前尖峰之后时发生增强,而突触前尖峰在前时发生抑制,与生物数据一致。
  • 仿真结果证实,当突触权重根据该规则更新时,所得到的权重变化与实验观察到的尖峰时间差与权重修改之间的关系高度吻合。
  • 若神经活动演化以最小化预测误差,则该规则对应于对预测误差目标函数的随机梯度下降。
  • 该方法使得仅使用局部、基于速率且生物学上合理的学习规则即可训练深度监督神经网络,如Scellier和Bengio(2016)先前的工作所展示。
  • 该规则无需显式尖峰时间,但仍通过突触后活动的导数捕捉了STDP的本质时间不对称性。
  • 该方法为基于速率的神经回路动力学如何实现与反向传播一致的学习提供了理论基础,即使缺乏精确的尖峰时间。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。