Skip to main content
QUICK REVIEW

[논문 리뷰] GridMask Data Augmentation

Pengguang Chen, Shu Liu|arXiv (Cornell University)|2020. 01. 13.
Advanced Neural Network Applications참고 문헌 35인용 수 226
한 줄 요약

GridMask은 CNN 성능을 이미지 분류, 객체 검출, 의미론적 분할 전반에 걸쳐 향상시키는 간단하고 구조화된 정보 제거 증강 기법으로, 이전의 정보 제거 방법 및 AutoAugment를 능가하되 계산량은 더 낮다.

ABSTRACT

We propose a novel data augmentation method `GridMask' in this paper. It utilizes information removal to achieve state-of-the-art results in a variety of computer vision tasks. We analyze the requirement of information dropping. Then we show limitation of existing information dropping algorithms and propose our structured method, which is simple and yet very effective. It is based on the deletion of regions of the input image. Our extensive experiments show that our method outperforms the latest AutoAugment, which is way more computationally expensive due to the use of reinforcement learning to find the best policies. On the ImageNet dataset for recognition, COCO2017 object detection, and on Cityscapes dataset for semantic segmentation, our method all notably improves performance over baselines. The extensive experiments manifest the effectiveness and generality of the new method.

연구 동기 및 목표

  • 이미지 영역의 삭제와 보존의 균형을 통해 효과적인 데이터 증강을 촉진한다.
  • 구조화되고 비연속적인 방식으로 정보를 드롭하는 간단한 격자 기반 마스 masking 전략을 제안한다.
  • 여러 비전 작업과 데이터셋에서 GridMask의 효과를 입증한다.
  • 실전을 위한 견고한 가이드라인을 마련하기 위해 매개변수 선택과 변형을 분석한다.

제안 방법

  • 마스킹을 입력 x에 적용된 이진 격자 마스크 M으로 표현하고, x~ = x * M으로 얻는다.
  • 보존 비율 k와 드롭된 영역 크기 l = r * d를 제어하기 위해 매개변수 (r, d, delta_x, delta_y)를 사용하여 격자 단위를 정의한다.
  • 성공하지 못한 증강 사례를 최소화하기 위해 보존 비율, 단위 크기 및 변위 범위를 경험적으로 연구한다.
  • 학습 동안 마스크를 회전시키고 d를 변화시켜 증강 다양성을 높인다.
  • ImageNet, COCO, Cityscapes에서 GridMask를 평가하고, 기준선과 AutoAugment에 대해 역방향 GridMask 및 무작위 드롭과 같은 제거 변형을 포함한다.

실험 결과

연구 질문

  • RQ1구조화된 격자 기반 드롭 전략이 분류, 탐지, 분할 작업 전반에서 일반화 성능을 향상시키는가?
  • RQ2마스크 매개변수(r, d, delta_x, delta_y)가 성능과 강건성에 어떤 영향을 미치는가?
  • RQ3GridMask가 기존 정보 드롭 방법 및 AutoAugment보다 더 낮은 계산 비용으로 성능을 능가할 수 있는가?
  • RQ4그리드 마스크 변형(역방향 GridMask, 무작위 드롭)이 결과에 미치는 영향은 무엇인가?

주요 결과

  • GridMask은 ImageNet ResNet50를 76.5%에서 77.9%로, ResNet152를 78.3%에서 79.7%로 향상시킨다.
  • GridMask은 COCO2017 Faster-RCNN-50-FPN의 mAP를 37.4%에서 39.2%로, Faster-RCNN-X101-FPN을 41.2%에서 42.6%로 향상시킨다.
  • GridMask은 Cityscapes PSPNet50의 mIoU를 77.3%에서 78.1%로 향상시킨다.
  • CIFAR-10에서 GridMask은 여러 모델에서 더 높은 정확도를 보이며(예: ResNet-18이 95.28%에서 96.54%로).
  • GridMask은 여러 설정에서 Cutout, HaS, 및 AutoAugment를 능가하면서도 거의 계산 오버헤드를 추가하지 않는다.
  • 역방향 GridMask와 구조화된 드롭이 무작위 드롭보다 우수하여 접근법의 강건함을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.