[论文解读] Dual Path Networks
本文提出双路网络(Dual Path Networks, DPN),一种新颖的卷积神经网络(CNN)架构,通过双残差路径结合了ResNet的特征复用与DenseNet的特征探索优势。通过在两条独立路径间共享特征并实现独立学习,DPN在ImageNet-1k、Places365和PASCAL VOC数据集上实现了最先进性能,模型参数量减少26%,浮点运算量(FLOPs)降低25%,内存占用减少8%,训练速度比ResNeXt-101(64x4d)快一倍。
In this work, we present a simple, highly efficient and modularized Dual Path Network (DPN) for image classification which presents a new topology of connection paths internally. By revealing the equivalence of the state-of-the-art Residual Network (ResNet) and Densely Convolutional Network (DenseNet) within the HORNN framework, we find that ResNet enables feature re-usage while DenseNet enables new features exploration which are both important for learning good representations. To enjoy the benefits from both path topologies, our proposed Dual Path Network shares common features while maintaining the flexibility to explore new features through dual path architectures. Extensive experiments on three benchmark datasets, ImagNet-1k, Places365 and PASCAL VOC, clearly demonstrate superior performance of the proposed DPN over state-of-the-arts. In particular, on the ImagNet-1k dataset, a shallow DPN surpasses the best ResNeXt-101(64x4d) with 26% smaller model size, 25% less computational cost and 8% lower memory consumption, and a deeper DPN (DPN-131) further pushes the state-of-the-art single model performance with about 2 times faster training speed. Experiments on the Places365 large-scale scene dataset, PASCAL VOC detection dataset, and PASCAL VOC segmentation dataset also demonstrate its consistently better performance than DenseNet, ResNet and the latest ResNeXt model over various applications.
研究动机与目标
- 通过在单一架构中结合ResNet与DenseNet的优势,解决现有深层网络的局限性。
- 通过一种新颖的双路拓扑结构,同时实现高效的特征复用与新型特征探索。
- 在保持或提升图像分类基准性能的同时,降低计算与内存开销。
- 在ImageNet-1k、Places365和PASCAL VOC上实现最先进性能,并提升训练效率。
提出的方法
- 提出一种双路残差模块,包含两条独立的特征路径:一条用于特征复用(类似ResNet),另一条用于特征探索(类似DenseNet)。
- 引入一种新颖的身份映射机制,实现在两条路径间共享特征的同时保持梯度流动。
- 采用分层特征融合策略,将两条路径的特征拼接后输入共享的瓶颈模块进行处理。
- 设计模块化架构,支持将双路模块堆叠形成深层网络(如DPN-131)。
- 使用HORNN框架形式化证明ResNet与DenseNet的等价性,为双路设计提供理论依据。
- 通过最小化冗余计算与内存访问,优化网络推理效率。
实验结果
研究问题
- RQ1能否通过统一架构有效结合ResNet的特征复用优势与DenseNet的特征探索优势,以提升表征学习能力?
- RQ2与单路架构相比,双路设计在准确率、参数效率与训练速度方面表现如何?
- RQ3双路机制在不牺牲大规模基准性能的前提下,能在多大程度上减少模型尺寸与FLOPs?
- RQ4所提出的DPN在图像分类、场景识别、目标检测与语义分割等多样化视觉任务中是否具备良好的泛化能力?
主要发现
- 在ImageNet-1k上,浅层DPN的Top-1准确率优于ResNeXt-101(64x4d),模型尺寸小26%,FLOPs降低25%。
- 深层DPN-131模型在ImageNet-1k上创下新的单模型最先进性能,训练速度比ResNeXt-101快2倍。
- 在Places365数据集上,DPN在场景识别准确率上优于DenseNet、ResNet与ResNeXt,且计算成本更低。
- 在PASCAL VOC目标检测与语义分割任务中,DPN始终优于ResNet、DenseNet及最新的ResNeXt模型。
- 与ResNeXt-101(64x4d)相比,DPN在保持更高准确率的同时,内存消耗降低8%。
- 双路设计实现了高效的特征学习,提升了梯度流动效率,并减少了特征图中的冗余。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。