[论文解读] Single-phase deep learning in cortico-cortical networks
BurstCCN 在深层皮质网络中提供单相、背向传播样的信用分配,使用 bursting、STP 和树突靶向的中间神经元,使 MNIST 与 CIFAR-10 学习成为可能。
The error-backpropagation (backprop) algorithm remains the most common solution to the credit assignment problem in artificial neural networks. In neuroscience, it is unclear whether the brain could adopt a similar strategy to correctly modify its synapses. Recent models have attempted to bridge this gap while being consistent with a range of experimental observations. However, these models are either unable to effectively backpropagate error signals across multiple layers or require a multi-phase learning process, neither of which are reminiscent of learning in the brain. Here, we introduce a new model, Bursting Cortico-Cortical Networks (BurstCCN), which solves these issues by integrating known properties of cortical networks namely bursting activity, short-term plasticity (STP) and dendrite-targeting interneurons. BurstCCN relies on burst multiplexing via connection-type-specific STP to propagate backprop-like error signals within deep cortical networks. These error signals are encoded at distal dendrites and induce burst-dependent plasticity as a result of excitatory-inhibitory top-down inputs. First, we demonstrate that our model can effectively backpropagate errors through multiple layers using a single-phase learning process. Next, we show both empirically and analytically that learning in our model approximates backprop-derived gradients. Finally, we demonstrate that our model is capable of learning complex image classification tasks (MNIST and CIFAR-10). Overall, our results suggest that cortical features across sub-cellular, cellular, microcircuit and systems levels jointly underlie single-phase efficient deep learning in the brain.
研究动机与目标
- 为多层网络中的信用分配提供一个生物学上合理的解决方案。
- 提出 BurstCCN,使用 bursting、短时塑性(short-term plasticity)以及树突靶向的中间神经元来传播误差信号。
- 展示单相学习及分析,显示与反向传播梯度的一致性。
- 在多种架构设定下展示对深层图像分类任务(MNIST 和 CIFAR-10)的学习能力。
提出的方法
- 介绍 Bursting Cortico-Cortical Networks (BurstCCN),其在远端树突中编码误差信号,从而诱导爆发依赖的可塑性。
- 使用 Burst Ensemble Multiplexing 通过 STD/STF 连接分离推理信号(速率)和误差信号(爆发)。
- 实现 Q (STD) 和 Y (STF) 反馈通路以传播向后信号并使顶端电位静默。
- 提供基于速率、连续时间和脉冲实现,以演示单相学习。
- 在弱反馈和对称性条件下,展示 BurstCCN 更新对反向传播梯度的解析近似。
- 在 MNIST 与 CIFAR-10 上评估,使用不同的反馈制度(对称 vs 随机)。
实验结果
研究问题
- RQ1BurstCCN 是否能够在单个学习阶段通过多层反向传播误差信号?
- RQ2BurstCCN 的学习动态是否近似于反向传播导出的梯度?
- RQ3BurstCCN 是否能够在生物学上合理的反馈下学习深层图像分类任务(MNIST、CIFAR-10)?
- RQ4Q 反馈和 Y 反馈在实现误差信号传递与学习稳定性中的作用是什么?
主要发现
- BurstCCN 能在单一学习阶段学习,在单相条件下在 XOR 上优于 Burstprop。
- 在解析与实证层面,当反馈较弱且存在 Q-Y 对称性时,BurstCCN 的更新近似反向传播梯度。
- 在具有深层网络的 MNIST 上,BurstCCN(Q-Y 对称)达到 1.84% 的测试误差,可与 Burstprop 相当,在更深的网络中优于 EDN。
- 在 CIFAR-10 上,带对称反馈的 BurstCCN 达到 22.92% 的测试误差,接近对称 ANN 的表现,且优于随机反馈设置。
- Q 反馈学习规则使顶端电位静默化,从而实现单相学习并在多种条件下与 backprop/feedback alignment 对齐。
- BurstCCN 仍然能够在更深的网络和动态输入输出情景中进行类似于反向传播的学习。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。