[论文解读] Dendritic error backpropagation in deep cortical microcircuits
该论文提出了一种基于树突误差反向传播的生物可实现机制,用于皮层微circuits中的深度学习:锥体神经元通过顶向下反馈与侧向抑制之间的不匹配,在 apical 树突上计算预测误差,从而驱动基底树突上的突触可塑性。该模型近似于深度网络中的反向传播,并在 MNIST 分类和重构任务中表现出色,其扩展版本还可实现类似注意力的去噪与原型生成功能。
Animal behaviour depends on learning to associate sensory stimuli with the desired motor command. Understanding how the brain orchestrates the necessary synaptic modifications across different brain areas has remained a longstanding puzzle. Here, we introduce a multi-area neuronal network model in which synaptic plasticity continuously adapts the network towards a global desired output. In this model synaptic learning is driven by a local dendritic prediction error that arises from a failure to predict the top-down input given the bottom-up activities. Such errors occur at apical dendrites of pyramidal neurons where both long-range excitatory feedback and local inhibitory predictions are integrated. When local inhibition fails to match excitatory feedback an error occurs which triggers plasticity at bottom-up synapses at basal dendrites of the same pyramidal neurons. We demonstrate the learning capabilities of the model in a number of tasks and show that it approximates the classical error backpropagation algorithm. Finally, complementing this cortical circuit with a disinhibitory mechanism enables attention-like stimulus denoising and generation. Our framework makes several experimental predictions on the function of dendritic integration and cortical microcircuits, is consistent with recent observations of cross-area learning, and suggests a biological implementation of deep learning.
研究动机与目标
- 为大脑中长期存在的信用分配问题提供解决方案,即在多个处理阶段协调突触修改以实现期望的行为结果。
- 提出一种在皮层微circuits架构内运行的、生物可实现的类经典反向传播替代方案,特别关注树突 compartment 和特定中间神经元类型的作用。
- 证明局部树突预测误差——源于顶向下反馈与侧向抑制之间的不匹配——可驱动深度多区域神经网络中的有效学习。
- 通过引入去抑制机制扩展模型,以实现刺激去噪与原型生成,模拟注意力功能。
提出的方法
- 模型采用具有独立胞体、基底和 apical compartment 的锥体神经元,其中 apical 树突整合来自下游区域的顶向下反馈以及来自生长抑素表达(SST)中间神经元的侧向抑制。
- 预测误差以 apical 树突膜电位与预测的顶向下输入之间的偏差形式编码,误差信号向胞体传播并触发基底树突突触的可塑性。
- 突触可塑性由基于误差信号的局部学习规则控制,权重更新基于误差的低通滤波版本,以稳定学习过程。
- 网络通过两步动力学进行训练:首先正向计算自下而上的激活;随后按逆序应用顶向下反馈,以更新中间神经元和锥体细胞的膜电位。
- 引入涉及 VIP 中间神经元的去抑制机制,通过在回忆阶段选择性抑制侧向抑制,实现对已学习原型的回忆与输入去噪。
- 模型在 MNIST 分类与重构任务上进行验证,采用离散时间、两步更新规则,以较低计算成本近似循环动力学。
实验结果
研究问题
- RQ1apical compartment 中的树突预测误差能否作为反向传播中全局误差信号的生物可实现替代?
- RQ2如何通过树突误差信号驱动局部突触可塑性,以近似于深度网络中的反向传播?
- RQ3该模型能否通过可塑的中间神经元连接学习预测并抵消顶向下反馈,从而实现网络的自洽运行?
- RQ4添加去抑制机制后,网络能否实现输入去噪并生成已学习刺激的原型?
主要发现
- 该模型在 MNIST 手写数字分类任务中成功学习,测试误差率与标准深度学习基准相当,证明了在多个皮层区域间有效实现信用分配。
- 通过局部树突误差信号实现稳定学习,该信号近似于全局反向传播算法,尤其在低树突耦合条件下表现更优。
- 通过利用抑制解除模式抑制侧向抑制,网络能够从噪声输入中重构出清晰图像,实现有效的刺激去噪。
- 通过在自顶向下、去抑制的回忆模式下运行,网络能够生成已学习数字类别的原型表示,产生连贯的图像重构。
- 该模型对噪声和初始化具有鲁棒性,训练过程通过低通滤波可塑性诱导信号得到稳定。
- 该框架提出了可实验验证的预测,例如 SST 和 VIP 中间神经元在学习过程中编码与调节预测误差的作用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。