[论文解读] Efficient Neural Architecture Transformation Search in Channel-Level for Object Detection
该论文提出神经架构转换搜索(NATS),一种基于梯度的、通道级别的搜索方法,通过重用ImageNet预训练模型实现目标检测,无需从头开始训练。通过学习高效的架构转换以将分类网络适配至检测任务,NATS在不增加额外参数或FLOPs的前提下,在COCO上实现了最先进性能,从而可在实时应用中实现快速、硬件友好的部署。
Recently, Neural Architecture Search has achieved great success in large-scale image classification. In contrast, there have been limited works focusing on architecture search for object detection, mainly because the costly ImageNet pretraining is always required for detectors. Training from scratch, as a substitute, demands more epochs to converge and brings no computation saving. To overcome this obstacle, we introduce a practical neural architecture transformation search(NATS) algorithm for object detection in this paper. Instead of searching and constructing an entire network, NATS explores the architecture space on the base of existing network and reusing its weights. We propose a novel neural architecture search strategy in channel-level instead of path-level and devise a search space specially targeting at object detection. With the combination of these two designs, an architecture transformation scheme could be discovered to adapt a network designed for image classification to task of object detection. Since our method is gradient-based and only searches for a transformation scheme, the weights of models pretrained in ImageNet could be utilized in both searching and retraining stage, which makes the whole process very efficient. The transformed network requires no extra parameters and FLOPs, and is friendly to hardware optimization, which is practical to use in real-time application. In experiments, we demonstrate the effectiveness of NATS on networks like {\em ResNet} and {\em ResNeXt}. Our transformed networks, combined with various detection frameworks, achieve significant improvements on the COCO dataset while keeping fast.
研究动机与目标
- 解决需要ImageNet预训练的目标检测模型所面临的高计算成本和长训练时间问题。
- 在不从头训练或增加额外参数的情况下,实现目标检测的高效架构搜索。
- 开发一种在搜索和微调阶段均可复用预训练权重的搜索方法,以提升效率。
- 设计一个专为提升目标检测性能而定制的通道级别搜索空间。
- 设计一种适用于实时部署的实用且硬件优化的架构转换方案。
提出的方法
- 提出一种基于梯度的神经架构搜索策略,操作于通道级别而非路径级别,以降低搜索复杂度。
- 引入一种新颖的搜索空间,聚焦于通道级变换,如通道缩放和合并,以将分类网络适配至检测任务。
- 在整个搜索和微调阶段复用ImageNet预训练权重,避免从头开始训练。
- 采用可微分的搜索机制,实现转换策略的端到端优化。
- 设计转换方案以保持模型效率,确保参数量和FLOPs不增加。
- 将所学转换应用于现有网络(如ResNet和ResNeXt),并集成至多种检测框架中。
实验结果
研究问题
- RQ1通道级别的架构搜索策略能否有效将ImageNet预训练的分类网络适配至目标检测任务?
- RQ2搜索过程能否在复用预训练权重的前提下实现高效且可微分?
- RQ3所提出的转换方案是否能在不增加FLOPs或参数量的情况下提升检测性能?
- RQ4该方法能否在计算开销极小的情况下实现在COCO上的最先进结果?
- RQ5该方法在不同主干网络架构和检测框架之间是否具有良好的泛化能力?
主要发现
- 所提出的NATS方法在应用于ResNet和ResNeXt主干网络时,在COCO目标检测基准上实现了显著的性能提升。
- 经转换的网络在不增加任何参数或FLOPs的前提下,优于其原始版本,且在多种检测框架中表现优异。
- 通过在整个过程中复用ImageNet预训练权重,该方法实现了快速收敛和高效训练。
- 由于采用基于梯度的优化和通道级操作,搜索过程计算效率高。
- 所得模型具有硬件友好性,适用于实时推理应用。
- 该方法在不同检测框架和主干网络架构之间表现出强大的泛化能力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。