Skip to main content
QUICK REVIEW

[논문 리뷰] FBNetV2: Differentiable Neural Architecture Search for Spatial and Channel Dimensions

Alvin Wan, Xiaoliang Dai|arXiv (Cornell University)|2020. 04. 12.
Advanced Neural Network Applications참고 문헌 38인용 수 29
한 줄 요약

FBNetV2는 특징 맵 재사용을 위한 마스킹 메커니즘을 사용함으로써 공간(입력 해상도) 및 채널 차원(필터 수)에 대한 효율적인 동시 탐색을 가능하게 하는 차별형 신경망 아키텍처 탐색(DMaskingNAS) 방법을 도입한다. 이 방법은 메모리 및 계산 비용이 거의 일정한 상태에서 탐색 공간을 최대 10^14배로 확장하며, MobileNetV3-Small 대비 15% 적은 FLOPs, Efficient-B0 대비 20% 적은 FLOPs로 최신 기준 성능을 달성한다.

ABSTRACT

Differentiable Neural Architecture Search (DNAS) has demonstrated great success in designing state-of-the-art, efficient neural networks. However, DARTS-based DNAS's search space is small when compared to other search methods', since all candidate network layers must be explicitly instantiated in memory. To address this bottleneck, we propose a memory and computationally efficient DNAS variant: DMaskingNAS. This algorithm expands the search space by up to $10^{14} imes$ over conventional DNAS, supporting searches over spatial and channel dimensions that are otherwise prohibitively expensive: input resolution and number of filters. We propose a masking mechanism for feature map reuse, so that memory and computational costs stay nearly constant as the search space expands. Furthermore, we employ effective shape propagation to maximize per-FLOP or per-parameter accuracy. The searched FBNetV2s yield state-of-the-art performance when compared with all previous architectures. With up to 421$ imes$ less search cost, DMaskingNAS finds models with 0.9% higher accuracy, 15% fewer FLOPs than MobileNetV3-Small; and with similar accuracy but 20% fewer FLOPs than Efficient-B0. Furthermore, our FBNetV2 outperforms MobileNetV3 by 2.6% in accuracy, with equivalent model size. FBNetV2 models are open-sourced at https://github.com/facebookresearch/mobile-vision.

연구 동기 및 목표

  • DNAS에서 메모리 및 계산 비용이 큰 제약을 받는 문제를 해결하여, 특히 공간 및 채널 차원의 탐색 공간 크기를 제한하지 않도록 하는 것.
  • 메모리나 계산 비용이 과도하지 않도록, 차별형 프레임워크 내에서 입력 해상도와 필터 수를 동시에 탐색할 수 있도록 하는 것.
  • ImageNet에서 효율적인 신경망에 대해 정확도, FLOPs, 모델 크기 측면에서 최신 기준 성능을 달성하는 것.
  • 대규모 아키텍처 탐색을 지원하면서도 훈련 효율성을 유지하는 확장 가능하고 메모리 효율적인 DNAS 방법을 개발하는 것.

제안 방법

  • 공유 슈퍼그래프 내에서 다수의 채널 및 해상도 옵션을 표현하기 위해 학습 가능한 마스크를 사용하는 DNAS의 변종인 DMaskingNAS를 도입하여 동시 최적화를 가능하게 한다.
  • 특징 맵이 가중치 마스크 조합을 통해 모든 채널 및 해상도 옵션 간에 재사용되도록 마스킹 메커니즘을 적용함으로써 메모리 및 계산 오버헤드를 최소화한다.
  • 탐색 중 정확한 기울기 전파 및 성능 추정을 보장하기 위해 효과적인 형태 전파 기법을 적용하여 FLOPs 및 파라미터 당 정확도를 극대화한다.
  • 훈련 중 최적의 채널 및 해상도 구성 선택을 위해 Gumbel-Softmax를 사용한 가중치 공유 근사 기법을 적용한다.
  • 채널 수, 커널 크기, 레이어 수, 버티브 블록 유형, 입력 해상도, 확장 비율의 6개 아키텍처 차원을 동시에 탐색할 수 있도록 지원한다.
  • 모든 후보 아키텍처가 암시적으로 표현되는 슈퍼그래프 설정을 활용하여, 극도로 확장된 탐색 공간에서 엔드 투 엔드 차별형 최적화를 가능하게 한다.

실험 결과

연구 질문

  • RQ1DNAS가 메모리나 계산 비용이 과도하지 않도록 하면서도 공간(입력 해상도) 및 채널(필터 수) 차원에 대해 효율적으로 탐색할 수 있는가?
  • RQ2큰 수의 채널 및 해상도 옵션 간에 특징 맵 재사용을 어떻게 달성하여 탐색 중 메모리 사용량을 거의 일정하게 유지할 수 있는가?
  • RQ3차별형 탐색 프레임워크가 최신 기준 성능을 달성하기 위해 매크로 아키텍처(해상도, 채널 수)와 마이크로 아키텍처(블록)를 동시에 최적화할 수 있는가?
  • RQ4기존 방법 대비 최대 10^14배로 확장된 탐색 공간이 최종 모델의 정확도 및 효율성에 미치는 영향은 무엇인가?
  • RQ5제안된 방법이 기존 수작업 및 자동 설계된 모델보다 더 낮은 FLOPs 또는 파라미터 수로 뛰어난 정확도를 달성할 수 있는가?

주요 결과

  • FBNetV2-F1은 56M FLOPs로 ImageNet에서 68.3%의 top-1 정확도를 달성하며, MobileNetV3-Small 대비 0.9% 높은 정확도를 기록하고 FLOPs는 15% 적게 소모한다.
  • FBNetV2-F4는 238M FLOPs로 76.0%의 top-1 정확도를 기록하며, ResNet-50의 정확도를 충족하지만 훨씬 더 효율적이다.
  • FBNetV2-P1은 단지 4M 파라미터로 MobileNetV3 대비 2.6% 높은 정확도, FBNet 대비 2.9% 높은 정확도를 기록하여 뛰어난 파라미터 효율성을 입증한다.
  • FBNetV2의 탐색 비용은 8개 GPU에서 27시간으로, 더 높은 정확도를 기록함에도 불구하고 MobileNetV3-Small의 탐색 비용 대비 421배 적다.
  • DMaskingNAS는 블록당 32개의 채널 옵션을 지원할 때도 거의 일정한 메모리 비용을 유지하지만, 기존 DNAS는 8개 옵션을 초과하면 메모리에 들어가지 못한다.
  • FBNetV2-L1은 325M FLOPs로 77.2%의 top-1 정확도를 기록하며, FLOPs가 390M인 EfficientNet-B0(77.3%)를 뛰어넘어 더 뛰어난 FLOP 효율성을 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.