Skip to main content
QUICK REVIEW

[논문 리뷰] Data Augmentation by Pairing Samples for Images Classification

Hiroshi Inoue|arXiv (Cornell University)|2018. 01. 09.
Machine Learning and Data Classification참고 문헌 11인용 수 338
한 줄 요약

SamplePairing은 두 개의 임의로 선택된 학습 이미지를 겹쳐 새로운 학습 샘플을 합성하고, 첫 번째 이미지의 레이블을 사용하여 다수의 데이터셋에서 특히 데이터가 제한될 때 상당한 정확도 향상을 얻는다.

ABSTRACT

Data augmentation is a widely used technique in many machine learning tasks, such as image classification, to virtually enlarge the training dataset size and avoid overfitting. Traditional data augmentation techniques for image classification tasks create new samples from the original training data by, for example, flipping, distorting, adding a small amount of noise to, or cropping a patch from an original image. In this paper, we introduce a simple but surprisingly effective data augmentation technique for image classification tasks. With our technique, named SamplePairing, we synthesize a new sample from one image by overlaying another image randomly chosen from the training data (i.e., taking an average of two images for each pixel). By using two images randomly selected from the training set, we can generate $N^2$ new samples from $N$ training samples. This simple data augmentation technique significantly improved classification accuracy for all the tested datasets; for example, the top-1 error rate was reduced from 33.5% to 29.0% for the ILSVRC 2012 dataset with GoogLeNet and from 8.22% to 6.93% in the CIFAR-10 dataset. We also show that our SamplePairing technique largely improved accuracy when the number of samples in the training set was very small. Therefore, our technique is more valuable for tasks with a limited amount of training data, such as medical imaging tasks.

연구 동기 및 목표

  • 제한된 학습 데이터로 이미지 분류의 일반화 성능 향상을 촉진한다.
  • 샘플을 페어링하여 효과적인 학습 세트를 확장하는 간단한 데이터 증강 방법을 도입한다.
  • 표준 벤치마크에서 SamplePairing을 평가하고 다른 증강 방법과의 상호작용을 분석한다.

제안 방법

  • 훈련 인스턴스당 두 개의 임의로 선택된 학습 이미지를 평균 내어 새로운 이미지를 합성한다.
  • 섞인 이미지에 첫 번째 이미지의 레이블을 할당하고 두 번째 이미지의 레이블은 무시한다.
  • 네트워크 아키텍처를 수정하지 않고 기존 증강과 SamplePairing을 통합한다.
  • 초기 에포크 이후에 SamplePairing을 활성화하고 훈련 중 주기적으로 비활성화하는 단계적 학습 방식으로 평가한다.
  • 레이블 혼합 없이 등가 가중 페어링의 이점을 분리하기 위해 mixup, Between-class learning 등 관련 방법과 비교한다.

실험 결과

연구 질문

  • RQ1SamplePairing이 기본 증강 대비 ILSVRC, CIFAR-10/100, SVHN 등 데이터셋에서 일반화를 개선하는가?
  • RQ2오버레이 이미지로 학습 데이터에서 선택하는지 외부 데이터에서 선택하는지가 성능에 어떤 영향을 미치는가?
  • RQ3동일 가중 평균(레이블 혼합 없음)이 레이블 혼합 또는 가중 혼합을 사용하는 방법만큼 효과적인가?
  • RQ4학습 데이터가 작거나 불균형일 때 SamplePairing의 성능은 어떠한가?
  • RQ5훈련 중간에 간헐적으로 SamplePairing을 비활성화하는 것이 최종 성능에 어떤 영향을 미치는가?

주요 결과

  • SamplePairing은 기준선에 비해 ILSVRC, CIFAR-10, CIFAR-100, SVHN의 검증 오차를 감소시킨다.
  • GoogLeNet을 사용한 ILSVRC에서 top-1 에러가 33.5%에서 29.0%로 감소했다.
  • 간단한 6층 네트워크로 CIFAR-10의 오차가 8.22%에서 6.93%로 감소했다.
  • 제한된 학습 데이터(예: CIFAR-10에서 클래스당 100개 샘플)일 때 정확도 향상이 더 크다(예: 43.1%에서 31.0%로).
  • 학습 세트 외부의 이미지를 오버레이하는 것은 개선을 가져오지만 학습 세트 내 오버레이를 사용하는 것만큼 효과적이지 않다.
  • 단일 이미지의 레이블만 사용하는 것(레이블 혼합 없음)은 레이블을 혼합하는 방법과 비슷한 성능을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.