Skip to main content
QUICK REVIEW

[论文解读] MorphNet: Fast & Simple Resource-Constrained Structure Learning of Deep Networks

Ariel Gordon, Elad Eban|arXiv (Cornell University)|Nov 18, 2017
Domain Adaptation and Few-Shot Learning参考文献 31被引用 48
一句话总结

MorphNet 是一种可扩展的、资源受限的神经架构搜索方法,通过基于激活的稀疏性正则化,迭代地剪枝和扩展网络,自动学习最优的深度网络结构。它在保持每次推理 FLOPs 不变的前提下,实现了最先进的性能提升——在 JFT 数据集上相对 MAP 提升高达 2.1%,优于人工设计的模型(如 Inception-v2 和 MobileNet),且额外训练成本极低。

ABSTRACT

We present MorphNet, an approach to automate the design of neural network structures. MorphNet iteratively shrinks and expands a network, shrinking via a resource-weighted sparsifying regularizer on activations and expanding via a uniform multiplicative factor on all layers. In contrast to previous approaches, our method is scalable to large networks, adaptable to specific resource constraints (e.g. the number of floating-point operations per inference), and capable of increasing the network's performance. When applied to standard network architectures on a wide variety of datasets, our approach discovers novel structures in each domain, obtaining higher performance while respecting the resource constraint.

研究动机与目标

  • 在特定硬件和效率约束下,自动化设计深度神经网络结构。
  • 解决现有基于稀疏性的方法无法针对特定计算资源(如 FLOPs)进行优化的局限性。
  • 开发一种可扩展的通用方法,在尊重用户定义的资源预算前提下提升性能。
  • 实现自动结构发现,其性能优于手工设计的架构,且无需大量试错或引入辅助网络。

提出的方法

  • MorphNet 在网络激活上使用资源加权的稀疏化正则化器,迭代剪枝不重要的神经元。
  • 在优化过程中,对所有层统一应用乘法缩放因子以扩展网络。
  • 通过设计一个正则化器 G,惩罚与目标资源的偏离,从而针对特定资源(如 FLOPs 或模型大小)进行优化。
  • 通过交替执行剪枝(通过稀疏性正则化)和扩展(通过缩放)操作,高效探索并优化架构空间。
  • 该方法在每个架构上仅需单次或少数几次训练迭代,计算效率高。
  • 当残差块中所有滤波器都被剪枝时,该方法可自然地实现整个层的移除,无需额外逻辑。

实验结果

研究问题

  • RQ1一种简单且可扩展的方法能否在严格的 FLOPs 约束下自动发现改进的 DNN 架构?
  • RQ2针对不同资源(如 FLOPs 与模型大小)进行优化,如何影响最终网络结构和性能?
  • RQ3MorphNet 是否能在大规模数据集(如 JFT 和 AudioSet)上实现性能提升,同时保持与基线模型相同的计算成本?
  • RQ4在相同的 FLOP 约束下,MorphNet 是否优于人工设计的模型(如 Inception-v2 和 MobileNet)?
  • RQ5与需要数月 GPU 时间的现有 NAS 方法相比,MorphNet 能在多大程度上降低训练成本?

主要发现

  • 在 JFT 数据集(350M 张图像,20K 个类别)上,MorphNet 在保持相同推理 FLOPs 的前提下,实现了 2.1% 的相对 MAP 提升。
  • 在 ImageNet 上,MorphNet 在不增加 FLOPs 的前提下,将 Inception-v2 的准确率提升了 1.1%,超过原始人工设计的架构。
  • 在 MobileNet 上,当 FLOPs 约束为 50% 时,MorphNet 实现了 1.78% 的相对准确率提升,证明其在已高度优化的模型上依然有效。
  • 当目标为 FLOPs 时,MorphNet 剪枝了早期计算量高的层;当目标为模型大小时,它移除了后期层中参数量大的 3×3 卷积。
  • 该方法为每种约束条件发现了结构上不同的改进型架构,表明针对特定约束进行优化可获得更优的权衡。
  • MorphNet 的总训练成本仅比训练单个基线模型高约 5%,与需要数月 GPU 时间的 NAS 方法相比,效率极高。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。