[논문 리뷰] Random Erasing Data Augmentation
Random Erasing은 학습 이미지에서 무작위 직사각형 영역을 가리는 파라미터 없는 데이터 증강 기법으로, 분류, 탐지, 재 식별(re-id) 작업에서의 가림에 대한 일반화 성능을 향상시킵니다.
In this paper, we introduce Random Erasing, a new data augmentation method for training the convolutional neural network (CNN). In training, Random Erasing randomly selects a rectangle region in an image and erases its pixels with random values. In this process, training images with various levels of occlusion are generated, which reduces the risk of over-fitting and makes the model robust to occlusion. Random Erasing is parameter learning free, easy to implement, and can be integrated with most of the CNN-based recognition models. Albeit simple, Random Erasing is complementary to commonly used data augmentation techniques such as random cropping and flipping, and yields consistent improvement over strong baselines in image classification, object detection and person re-identification. Code is available at: https://github.com/zhunzhong07/Random-Erasing.
연구 동기 및 목표
- CNN의 일반화 향상을 위해 가림을 시뮬레이션한다.
- 기존 CNN과 통합될 수 있는 간단하고 파라미터 없는 증강을 제안한다.
- 이미지 분류, 객체 탐지, 사람 재식별에서의 효과를 입증한다.
- 가림에 대한 견고성과 다른 증강과의 보완성을 보여준다.
제안 방법
- 훈련 중 p 확률로 이미지에서 직사각형 영역을 무작위로 선택한다.
- 선정된 영역을 무작위 픽셀 값(또는 ImageNet 평균)으로 채워 지워진 영역으로 만든다
- 영역의 면적 s_l–s_h와 종횡비 r_1–r_2를 통해 지워짐 영역의 크기를 조정하여 다양한 가림 수준을 생성한다
- 전체 이미지에서 영역을 가려 이미지 분류 및 사람 재식별에 Random Erasing을 적용한다.
- 객체 탐지의 경우 이미지 인식형(IRE), 객체 인식형(ORE), 이미지+객체 인식형(I+ORE) 세 가지 스킴을 적용한다.
- Random Erasing을 랜덤 크롭 및 크롭 기반 증강과 비교하여 상보성을 연구한다.
- 추가적인 파라미터 학습이 필요하지 않으며 경량화되어 쉽게 통합된다.
실험 결과
연구 질문
- RQ1Random Erasing이 여러 비전 과제에서 가림 아래 CNN의 일반화 향상을 가져오는가?
- RQ2지우기 확률, 영역, 종횡비가 성능에 어떤 영향을 미치는가?
- RQ3Random Erasing이 랜덤 크롭 및 수평 뒤집이와 같은 다른 증강들과 보완적인가?
- RQ4이미지/객체 의식 스킴으로 객체 탐지에 방법을 적용할 수 있는가?
- RQ5기법이 가려진 테스트 예제에 대한 견고성을 제공하는가?],
- RQ6key_findings: [
주요 결과
- CIFAR-10, CIFAR-100, 및 Fashion-MNIST에서 다양한 아키텍처(예: ResNet 변종, WRN-28-10) 대비 Baseline보다 정확도가 향상됩니다.
- CIFAR-10에서 ResNet-110 및 WRN-28-10으로 Random Erasing은 테스트 오차를 주목할 만하게 감소시킵니다(예: WRN-28-10의 오차 3.08% 달성).
- Random Erasing은 Baseline보다 뒤처지지 않으며, random cropping 및 flipping과 같은 기존 증강보다 우수하거나 상호 보완적입니다.
- 객체 탐지에서 Fast-RCNN 학습 시 IRE, ORE, 또는 I+ORE를 적용하면 mAP가 향상됩니다(예: VOC07에서 I+ORE가 71.5% mAP 달성).
- 사람 재식별에서 Random Erasing은 Market-1501, DukeMTMC-reID, CUHK03 베이스라인 전반에 걸쳐 순위-1과 mAP를 지속적으로 향상시킵니다.
- Random Erasing은 가림에 대한 견고성을 높이며, CIFAR-10 가림 실험에서 Baseline에 비해 성능 저하가 느리게 나타났습니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.