Skip to main content
QUICK REVIEW

[论文解读] RepVGG: Making VGG-style ConvNets Great Again

Xiaohan Ding, Xiangyu Zhang|arXiv (Cornell University)|Jan 11, 2021
Advanced Neural Network Applications参考文献 43被引用 43
一句话总结

RepVGG 采用多分支训练时架构,然后通过结构重参数化在推理时转换为简单的 3x3 卷积主体,在 GPU 上实现快速推理且具有较高准确率。

ABSTRACT

We present a simple but powerful architecture of convolutional neural network, which has a VGG-like inference-time body composed of nothing but a stack of 3x3 convolution and ReLU, while the training-time model has a multi-branch topology. Such decoupling of the training-time and inference-time architecture is realized by a structural re-parameterization technique so that the model is named RepVGG. On ImageNet, RepVGG reaches over 80% top-1 accuracy, which is the first time for a plain model, to the best of our knowledge. On NVIDIA 1080Ti GPU, RepVGG models run 83% faster than ResNet-50 or 101% faster than ResNet-101 with higher accuracy and show favorable accuracy-speed trade-off compared to the state-of-the-art models like EfficientNet and RegNet. The code and trained models are available at https://github.com/megvii-model/RepVGG.

研究动机与目标

  • 激励设计一个简单、快速、低内存的 CNN,能与多分支架构相比肩。
  • 通过结构重参数化,将训练时的复杂性与推理时的简单性解耦。
  • 展示在 ImageNet 与语义分割任务上的性能和速度优势。

提出的方法

  • 提出 RepVGG,具有训练时多分支块(包括恒等和 1x1 分支)以及推理时的简单主体,由堆叠的 3x3 卷积再加 ReLU 构成。
  • 使用结构重参数化在部署时将训练时的多分支块转换为等效的单一 3x3 卷积核(BN 折叠与卷积核聚合)。
  • 推导将 BN 与前序卷积合并的方程,以及将 1x1 与恒等分支的贡献相加、填充到最终 3x3 内核中的方法(确保步幅与填充匹配)。
  • 以类似 VGG 的简单拓扑在 5 个阶段中实例化结构,使用 3x3 卷积和受控下采样、全局平均池化以及一个最终分类头。
  • 探索含有或不含分支的变体,对 BN 放置进行消融,并与 ResNet、EfficientNet 与 RegNet 基线进行对比。

实验结果

研究问题

  • RQ1训练时多分支设计是否可以重参数化为快速、纯粹推理时架构且不损失准确性?
  • RQ2RepVGG 的速度-准确性权衡在 ImageNet 上与最新模型(ResNet、EfficientNet、RegNet)相比如何?
  • RQ3采用 VGG 风格的 3x3 卷积的简单主体在 ImageNet 上是否具竞争力并可转移到语义分割?
  • RQ4在训练时结构中包含或移除恒等和 1x1 分支、BN 放置以及 ReLU 对最终性能有何影响?
  • RQ5结构重参数化是否在内存使用和部署简化方面带来实际收益?

主要发现

  • RepVGG 使用简单推理时架构在 ImageNet 上达到超过 80% 的 top-1 准确率,这在他们的报告中是第一例简单双模型。
  • 在 NVIDIA 1080Ti 上,RepVGG 模型比 ResNet-50 和 ResNet-101 运行更快且准确性更高,并且在速度-精度方面优于 EfficientNet 和 RegNet。
  • 具备交错分组卷积(g2/g4)的体系变体在速度上显著提升,带来适度的精度损失(例如 RepVGG-B1g4 相对于 ResNet-101)。
  • 结构重参数化(训练时多分支到推理时简单)被验证为关键:移除分支或 BN 放置会降低精度,而完全重参数化可获得最佳结果。
  • 在消融实验中,RepVGG 的训练时 BN 与分支在参数量之外带来优势,超越 DiracNet 与简单的重参数化。
  • RepVGG-B2/B3 变体展示了在 ImageNet 上的强劲性能(如最高 80.52% Top-1),在 FLOPs 竞争力和参数数量方面低于若干基线。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。