Skip to main content
QUICK REVIEW

[논문 리뷰] Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules

Daniel E. Ho, Eric Liang|arXiv (Cornell University)|2019. 05. 14.
Advanced Neural Network Applications참고 문헌 47인용 수 176
한 줄 요약

이 논문은 Population-Based Augmentation (PBA)를 소개한다. PBA는 Population Based Training을 통해 비정상적 증강 스케줄을 학습하여 AutoAugment의 성능을 훨씬 적은 계산으로 맞춘다. PBA는 CIFAR-10/100 및 SVHN에서 약 1000x의 GPU 시간 감소로 경쟁력 있는 결과를 달성한다.

ABSTRACT

A key challenge in leveraging data augmentation for neural network training is choosing an effective augmentation policy from a large search space of candidate operations. Properly chosen augmentation policies can lead to significant generalization improvements; however, state-of-the-art approaches such as AutoAugment are computationally infeasible to run for the ordinary user. In this paper, we introduce a new data augmentation algorithm, Population Based Augmentation (PBA), which generates nonstationary augmentation policy schedules instead of a fixed augmentation policy. We show that PBA can match the performance of AutoAugment on CIFAR-10, CIFAR-100, and SVHN, with three orders of magnitude less overall compute. On CIFAR-10 we achieve a mean test error of 1.46%, which is a slight improvement upon the current state-of-the-art. The code for PBA is open source and is available at https://github.com/arcelien/pba.

연구 동기 및 목표

  • 데이터 증강을 규제자(regularizer)로서 동기 부여하고, 큰 탐색 공간에서 효과적인 증강 정책을 선택하는 문제가 도전임을 확인한다.
  • 일반화 성능을 개선하기 위한 경량의 스케줄 기반 증강 탐색 방법을 제안한다.
  • 이전 AutoAugment 방식에 비해 계산 비용을 줄이면서 정확도를 유지하거나 향상시키려 한다.
  • PBA의 효과를 CIFAR-10, CIFAR-100 및 SVHN에서 시연하고 재현성을 위한 오픈 소스 코드를 제공한다.

제안 방법

  • 증강 정책 탐색을 하이퍼파라미터 스케줄 학습 문제로 형식화한다.
  • Population Based Training (PBT)을 사용하여 증강 파라미터와 모델 학습을 공동으로 최적화하고 시간에 따라 변하는 증강 스케줄 f(x,t)를 얻는다.
  • 15개의 연산으로 구성된 증강 정책 템플릿을 채택하고 각 연산은 확률과 크기의 두 하이퍼파라미터 및 각 연산의 두 복사를 가진다.
  • 배치당 적용 연산의 시퀀스-오브-오퍼레이션(0–2)의 한계를 정의하고 구조화된 탐색 함수로 하이퍼파라미터를 섭동한다.
  • 스케줄링의 가치를 stationary 증강과 비교하기 위해 고정 정책(AutoAugment 스타일) 및 무작위 baselines와 비교한다.

실험 결과

연구 질문

  • RQ1비정상적 증강 스케줄을 학습하는 것이 고정된 증강 정책보다 일반화를 더 잘 이끌어내는가?
  • RQ2PBA의 성능과 효율성이 CIFAR-10, CIFAR-100 및 SVHN 전반에 걸쳐 AutoAugment 및 무작위 baselines에 비해 어떤가?
  • RQ3증강 스케줄이 계산 비용과 확장성에 미치는 영향은 무엇인가?
  • RQ4검색 절차 및 스케줄 길이에 대한 하이퍼파라미터에 PBA는 얼마나 민감한가?

주요 결과

  • PBA는 CIFAR-10, CIFAR-100, 및 SVHN에서 AutoAugment 성능과 비슷한 성능을 약 1000x의 GPU 계산으로 달성한다.
  • CIFAR-10에서 PBA는 평균 테스트 오류 1.46%를 달성하여 당시의 최첨단보다 약간 개선되는 성능을 보인다.
  • PBA는 증강 스케줄 학습에 필요한 GPU 시간이 Titan XP에서 약 5시간에 불과하며 AutoAugment의 수천 GPU 시간에 비해 현저히 적다.
  • 스케줄 학습은 고정 정책이나 정적 분포보다 현저히 뛰어나며, 여러 모델에서 고정 정책은 정확도를 약 10% 감소시킨다.
  • PBA는 데이터세트와 모델 계열 전반에서 강인성을 보여주며 학습된 스케줄을 사용해 CIFAR-10/100 및 SVHN에서 경쟁력 있는 결과를 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.