Skip to main content
QUICK REVIEW

[论文解读] FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary

Shuicheng Yan, Jiahui Yu|arXiv (Cornell University)|Apr 30, 2020
Advanced Neural Network Applications参考文献 24被引用 9
一句话总结

FSNet 通过用共享的一维滤波器概要(FS)替换标准卷积滤波器,压缩深度卷积神经网络(CNN),其中重叠的滤波器段共享权重,显著减少参数量。该方法在极小精度损失下实现高倍压缩,并支持量化和可微训练,在图像分类和目标检测任务中优于基线模型。

ABSTRACT

We present a novel method of compression of deep Convolutional Neural Networks (CNNs) by weight sharing through a new representation of convolutional filters. The proposed method reduces the number of parameters of each convolutional layer by learning a 1D vector termed Filter Summary (FS). The convolutional filters are located in FS as overlapping 1D segments, and nearby filters in FS share weights in their overlapping regions in a natural way. The resultant neural network based on such weight sharing scheme, termed Filter Summary CNNs or FSNet, has a FS in each convolution layer instead of a set of independent filters in the conventional convolution layer. FSNet has the same architecture as that of the baseline CNN to be compressed, and each convolution layer of FSNet has the same number of filters from FS as that of the basline CNN in the forward process. With compelling computational acceleration ratio, the parameter space of FSNet is much smaller than that of the baseline CNN. In addition, FSNet is quantization friendly. FSNet with weight quantization leads to even higher compression ratio without noticeable performance loss. We further propose Differentiable FSNet where the way filters share weights is learned in a differentiable and end-to-end manner. Experiments demonstrate the effectiveness of FSNet in compression of CNNs for computer vision tasks including image classification and object detection, and the effectiveness of DFSNet is evidenced by the task of Neural Architecture Search.

研究动机与目标

  • 减少深度卷积神经网络(CNN)中的参数数量,同时保持精度损失最小。
  • 通过基于一维滤波器表示的新型权重重用机制,实现高效的模型压缩。
  • 设计一种与权重重量化兼容的压缩方法,以进一步减小模型尺寸。
  • 开发一种可微分版本,通过反向传播端到端学习最优权重重用模式。
  • 在真实世界计算机视觉任务中验证该方法,包括图像分类和目标检测。

提出的方法

  • 引入一种称为滤波器概要(FS)的一维向量,将多个卷积滤波器表示为重叠的一维段。
  • FSNet中的每个卷积层仅使用一个FS向量,而非独立的滤波器,且滤波器在重叠区域共享权重。
  • 前向传播保持与基线CNN相同的滤波器数量,确保架构兼容性。
  • 采用可微训练方案(DFSNet),通过反向传播端到端学习最优滤波器共享模式。
  • 支持权重重量化,实现进一步压缩且性能下降可忽略。
  • 使用标准CNN层并结合修改后的滤波器参数化方式,实现参数效率。

实验结果

研究问题

  • RQ1共享的一维滤波器表示是否能显著减少卷积层中的参数数量,同时保持模型精度?
  • RQ2滤波器概要化方法在实现高倍压缩率的同时,精度损失是否可忽略?
  • RQ3可微分版本方法(DFSNet)相较于非可微变体,在性能上提升程度如何?
  • RQ4所提出的方法是否能有效与权重重量化结合,以进一步减小模型尺寸?
  • RQ5该方法在包括图像分类和目标检测在内的多样化计算机视觉任务中是否具有良好泛化能力?

主要发现

  • FSNet 通过用共享的一维滤波器概要(FS)向量替代单个滤波器,在CNN中实现了显著的参数减少。
  • 该方法在每层保持与基线模型相同的滤波器数量,确保兼容性并维持一致的推理行为。
  • 由于参数数量大幅减少,FSNet 实现了高效的计算加速,在图像分类基准测试中精度损失极小。
  • 与权重重量化结合后,FSNet 实现了更高的压缩率,且性能损失不明显。
  • DFSNet(可微分变体)通过端到端学习,自动发现最优权重重用模式,在神经架构搜索任务中提升了性能。
  • 该方法在计算机视觉任务中表现出强大的泛化能力,涵盖图像分类和目标检测等任务。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。