Skip to main content
QUICK REVIEW

[论文解读] Deep Learning without Weight Symmetry

Jian Li, Marcus K. Benna|arXiv (Cornell University)|May 31, 2024
Neural Networks and Applications参考文献 8被引用 1
一句话总结

本文提出产品反馈对齐(PFA),一种生物上合理的信用分配算法,通过引入一个辅助神经元群体来传输误差信号,消除了深度学习中显式的权重对称性。PFA 在全连接网络和卷积网络中实现了与反向传播相近的性能,同时保持了极低的权重相关性,且无需双向突触连接,从而解决了生物学习中长期存在的权重对称性问题。

ABSTRACT

Backpropagation (BP), a foundational algorithm for training artificial neural networks, predominates in contemporary deep learning. Although highly successful, it is often considered biologically implausible. A significant limitation arises from the need for precise symmetry between connections in the backward and forward pathways to backpropagate gradient signals accurately, which is not observed in biological brains. Researchers have proposed several algorithms to alleviate this symmetry constraint, such as feedback alignment and direct feedback alignment. However, their divergence from backpropagation dynamics presents challenges, particularly in deeper networks and convolutional layers. Here we introduce the Product Feedback Alignment (PFA) algorithm. Our findings demonstrate that PFA closely approximates BP and achieves comparable performance in deep convolutional networks while avoiding explicit weight symmetry. Our results offer a novel solution to the longstanding weight symmetry problem, leading to more biologically plausible learning in deep convolutional networks compared to earlier methods.

研究动机与目标

  • 为解决反向传播中权重对称性的生物不现实性问题,即反馈权重必须精确镜像前向权重。
  • 解决权重对称性问题,该问题与神经生物学证据相矛盾,后者表明神经元之间不存在一致的双向连接。
  • 开发一种信用分配机制,实现在无需显式权重传输或对称反馈路径的情况下,对梯度进行准确近似。
  • 证明深度网络可仅通过局部、非对称的突触连接以及一个辅助误差传输群体,实现与反向传播相当的性能。

提出的方法

  • 引入一个辅助神经元群体,记为 $\bar{e}_l^k$,用于将误差信号从输出层传回激活为 $x_l$ 的层。
  • 使用前向激活 $x_l$ 与辅助误差信号 $\bar{e}_l^k$ 的乘积来计算前向权重的梯度更新,从而取代对称反馈权重的需求。
  • 采用一个固定且随机初始化的反馈矩阵 $B$,其每个突触的条目独立,避免了权重传输,并实现了前向与后向路径的完全解耦。
  • 应用路径对齐机制,确保通过 $B$ 的有效后向路径在方向上与前向路径对齐,从而最小化前向与后向权重方向之间的夹角。
  • 引入路径范数比度量以量化对齐质量,比值接近 1 表明对反向传播的强近似。
  • 使用小于 1 的扩展比例 $\lambda$ 来缩放辅助误差信号,以确保梯度近似的足够秩,同时保持生物合理性。

实验结果

研究问题

  • RQ1是否可以在前向与反馈路径之间不存在显式权重对称性的情况下实现深度网络中的信用分配?
  • RQ2当不存在从 postsynaptic 到 presynaptic 神经元的直接反馈突触时,一种生物上合理的学习规则能否近似反向传播?
  • RQ3一种避免双向连接但同时在标准视觉基准上保持高准确率的学习算法,其性能如何?
  • RQ4误差信号应如何有效传输,以实现在不依赖对称或传输权重的情况下实现准确的权重更新?
  • RQ5辅助神经元群体是否能够在保持连接模式生物合理性的同时,实现有效的梯度近似?

主要发现

  • PFA 在 ImageNet 上使用 ResNet-18 达到了 69.30% 的测试准确率,与标准反向传播的 69.69% 准确率非常接近。
  • PFA 的路径对齐角度约为 78°,路径范数比接近 1.0,表明前向与后向路径之间具有强对齐性。
  • PFA 消除了所有双向突触连接,导致权重对齐角度为 90°(零相关性),与大脑中观察到的对称权重缺失现象一致。
  • PFA 在 ImageNet 上优于其他生物上合理的算法,如 SF(准确率 64.63%)和 FA/DFA,表明其在复杂任务中具有更优性能。
  • 该算法在固定反馈权重 $B$ 的情况下仍保持高性能,且借助辅助误差群体的使用,实现了无需权重传输的准确梯度近似。
  • 该方法可通过解耦误差与激活信号的传输,灵活整合进现有生物框架,如 apical-basal 树突分离结构和基于爆发的信号复用机制。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。