Skip to main content
QUICK REVIEW

[논문 리뷰] Progressive Neural Architecture Search

Chenxi Liu, Barret Zoph|arXiv (Cornell University)|2017. 12. 02.
Advanced Neural Network Applications참고 문헌 41인용 수 166
한 줄 요약

PNAS는 CNN 셀 구조에 대한 점진적이고 대리모델 가이드 검색을 도입하여, 기존 RL 기반 NAS 방법들보다 최대 8배 더 빠른 계산으로 최첨단 정확도를 달성합니다.

ABSTRACT

We propose a new method for learning the structure of convolutional neural networks (CNNs) that is more efficient than recent state-of-the-art methods based on reinforcement learning and evolutionary algorithms. Our approach uses a sequential model-based optimization (SMBO) strategy, in which we search for structures in order of increasing complexity, while simultaneously learning a surrogate model to guide the search through structure space. Direct comparison under the same search space shows that our method is up to 5 times more efficient than the RL method of Zoph et al. (2018) in terms of number of models evaluated, and 8 times faster in terms of total compute. The structures we discover in this way achieve state of the art classification accuracies on CIFAR-10 and ImageNet.

연구 동기 및 목표

  • RL 및 EA 접근법과 비교하여 CNN용 NAS의 동기를 제시하고 계산 비용을 줄이는 것.
  • 확장을 가이드하기 위해 대리 예측기를 결합한 CNN 셀의 점진적이고 블록 단위의 검색을 제안한다.
  • 발견된 아키텍처가 더 낮은 계산량으로 CIFAR-10 및 ImageNet에서 최첨단 정확도에 도달함을 보여준다.
  • 단일 셀 유형을 공유하고 점진적으로 복잡성을 증가시키는 것이 탐색 효율성과 전이 가능성을 향상시킴을 보여준다.

제안 방법

  • 각 셀당 B개의 블록과 고정된 블록 연산 및 입력 세트를 갖는 계층적 셀 기반 탐색 공간을 정의한다.
  • 간단한(1-블록) 셀에서 더 깊은(B-블록) 셀로 후보를 확장하고 대리 모델로 성능을 예측하여 점진적으로 탐색을 수행한다.
  • 후보 셀로 구성된 프록시 CNN들의 집단을 학습시켜 검증 정확도를 지도 신호로 얻는다.
  • 확장된 셀을 순위를 매기기 위해 MLP 또는 RNN인 앙상블 대리 예측기를 훈련하고, 다음 세대를 위한 상위-K를 선택하며 새로운 관찰 데이터로 예측기를 업데이트한다.
  • 최고의 셀 유형을 지정된 반복수와 스트라이드 패턴으로 쌓아 최종 CNN을 구성한 뒤 대상 데이터세트(CIFAR-10 및 ImageNet)에서 학습한다.
  • NAS(RL 기반) 및 무작위 검색과의 효율성을 비교하고 모델 수, 총 계산량, 최고 검증 정확도를 보고한다.

실험 결과

연구 질문

  • RQ1점진적이고 대리 가이드가 있는 탐색이 정확도를 유지하거나 향상시키면서 NAS에서 평가된 모델 수를 줄일 수 있는가?
  • RQ2셀 기반의 점진적으로 복잡한 탐색 공간을 사용하면 ImageNet과 같은 더 큰 데이터셋에서 효율성과 전달 가능성을 향상시킬 수 있는가?
  • RQ3대리 예측기(MLP 대 RNN 앙상블)가 유망한 아키텍처의 순위를 얼마나 잘 매기고 더 크고 보지 못한 셀에 일반화되는가?
  • RQ4CIFAR-10 및 ImageNet에서 PNAS의 실용적 속도 향상과 정확도 간의 트레이드오프는 NAS, 무작위 검색 및 계층적 EA와 비교해 어떤가?

주요 결과

모델BNF오류매개변수M1E1M2E2비용
NASNet-A [41]56323.413.3M200000.9M25013.5M21.4-29.3B
NASNet-B [41]54N/A3.732.6M200000.9M25013.5M21.4-29.3B
NASNet-C [41]54N/A3.593.1M200000.9M25013.5M21.4-29.3B
Hier-EA [21]52643.75 ± 0.1215.7M70005.12M0035.8B
AmoebaNet-B [27]56363.37 ±0.042.8M270002.25M10027M63.5B
AmoebaNet-A [27]56363.34 ±0.063.2M200001.13M10027M25.2B
AmoebaNet-C [27]56363.35 ±0.053.2M200001.13M10027M25.2B
PNASNet-5 [PNAS]53483.41 ±0.093.2M11600.9M001.0B
  • PNAS는 평가된 모델 수 측면에서 Zoph et al.(2018)의 RL NAS 방법보다 최대 5배 더 효율적이다.
  • 같은 탐색 공간에서 RL NAS 방법에 비해 총 계산량이 최대 8배 빠르다.
  • PNAS로 발견된 아키텍처는 CIFAR-10 및 ImageNet에서 최첨단 또는 경쟁력 있는 분류 정확도를 달성한다.
  • 대리 가이드를 갖춘 점진적 탐색은 전체 CNN 직접 탐색보다 더 크고 복잡한 셀을 탐색하게 한다.
  • ML 기반 대리 앙상블(특히 MLP-앙상블)은 보지 못한 더 큰 블록 수에 대해 후보 셀의 순위를 효과적으로 매겨 탐색 효율을 향상시킨다.
  • PNASNet-5는 ImageNet에서 Mobile 및 Large 설정의 여러 NAS 변형보다 성능이 뛰어나고 AmoebaNet 구현보다 훨씬 적은 계산량을 사용한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.