Skip to main content
QUICK REVIEW

[论文解读] ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

Xiangyu Zhang, Xinyu Zhou|arXiv (Cornell University)|Jul 4, 2017
Advanced Neural Network Applications参考文献 66被引用 882
一句话总结

ShuffleNet 引入逐点分组卷积并结合通道洗牌操作,以构建极其高效的移动设备 CNN,在相似 FLOPs 下比 MobileNet 拥有更高的准确性,并在 ARM 架构上实现显著的真实世界加速。

ABSTRACT

We introduce an extremely computation-efficient CNN architecture named ShuffleNet, which is designed specially for mobile devices with very limited computing power (e.g., 10-150 MFLOPs). The new architecture utilizes two new operations, pointwise group convolution and channel shuffle, to greatly reduce computation cost while maintaining accuracy. Experiments on ImageNet classification and MS COCO object detection demonstrate the superior performance of ShuffleNet over other structures, e.g. lower top-1 error (absolute 7.8%) than recent MobileNet on ImageNet classification task, under the computation budget of 40 MFLOPs. On an ARM-based mobile device, ShuffleNet achieves ~13x actual speedup over AlexNet while maintaining comparable accuracy.

研究动机与目标

  • 设计一个在移动设备上针对非常低计算预算(几十到几百 MFLOPs)优化的 CNN 架构。
  • 在保持准确性的同时减少 1x1 卷积的计算。
  • 通过通道洗牌机制实现跨通道组的信息流有效流动。
  • 在 ImageNet 和 MS COCO 上展示优于同期轻量模型的性能。

提出的方法

  • 提出逐点分组卷积以降低 1x1 卷积成本。
  • 引入通道洗牌以在堆叠分组卷积之间实现跨组信息流。
  • 开发 ShuffleNet 单元,将 bottleneck 通道上的深度卷积与分组逐点卷积和通道洗牌相结合。
  • 将 ShuffleNet 组装成三阶段架构,分阶段下采样,bottleneck 通道设置为阶段输出通道的 1/4。
  • 用 FLOPs 分析计算复杂度,并在不同分组数(g)之间比较,以研究宽度与分组稀疏性之间的权衡。

实验结果

研究问题

  • RQ1将逐点分组卷积结合通道洗牌在严格 FLOP 预算下相比现有轻量化架构是否提高了准确性?
  • RQ2分组数(g)的增减如何影响小型网络的性能,通道洗牌是否能缓解信息流的潜在瓶颈?
  • RQ3ShuffleNet 是否能在 ImageNet 和 MS COCO 上以相同或更低的计算成本实现比 MobileNet 更高的准确性?
  • RQ4相较于理论的 FLOP 估算,ShuffleNet 对实际移动设备运行时的影响是什么?

主要发现

  • 在 ImageNet 上,ShuffleNet 在相似 FLOPs 下实现优越于 MobileNet 的准确性,例如在大约 40 MFLOPs 预算下,与 MobileNet 在可比条件下相比,top-1 错误率降低 7.8%。
  • 使用通道洗牌结合逐点分组卷积,在相同复杂度下实现更宽的特征图,特别是对较小网络提高准确性。
  • ShuffleNet 2x (g=3) 在 524 MFLOPs 下达到 26.3% 的 top-1 错误,比同预算下的几个紧凑架构表现更好。
  • 在基于 ARM 的移动硬件上,ShuffleNet 相对 AlexNet 取得约 13x 的实际速度提升,准确度相当(理论速度提升高达 18x)。
  • 通道洗牌持续提升性能,特别是在使用较大分组数(g)时,通过实现跨组信息流。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。