[논문 리뷰] Adversarial Dropout Regularization
ADR은 드롭아웃 기반의 적대적 비판기를 도입하여 경계 인식 특성 정렬을 강제하고, 비지도 도메인 적응에서 타깃 특징의 판별력을 분류 및 세분화 작업 전반에 걸쳐 개선하며, 반지도 학습 GAN 훈련을 가능하게 한다.
We present a method for transferring neural representations from label-rich source domains to unlabeled target domains. Recent adversarial methods proposed for this task learn to align features across domains by fooling a special domain critic network. However, a drawback of this approach is that the critic simply labels the generated features as in-domain or not, without considering the boundaries between classes. This can lead to ambiguous features being generated near class boundaries, reducing target classification accuracy. We propose a novel approach, Adversarial Dropout Regularization (ADR), to encourage the generator to output more discriminative features for the target domain. Our key idea is to replace the critic with one that detects non-discriminative features, using dropout on the classifier network. The generator then learns to avoid these areas of the feature space and thus creates better features. We apply our ADR approach to the problem of unsupervised domain adaptation for image classification and semantic segmentation tasks, and demonstrate significant improvement over the state of the art. We also show that our approach can be used to train Generative Adversarial Networks for semi-supervised learning.
연구 동기 및 목표
- 레이블이 있는 소스 도메인에서 레이블이 없는 타깃 도메인으로 신경 표현을 전이하려는 동기를 제시한다.
- 정렬 중 클래스 경계를 무시하는 전통적 도메인 비판기의 한계를 다룬다.
- 경계 인식적 적대적 드롭아웃으로 타깃 특징을 더 판별력 있게 만들기 위해 ADR을 개발한다.
- 도메인 적수를 넘어 반지도 학습 및 GAN에 대한 ADR의 적용 가능성을 보여준다.
제안 방법
- 도메인 비판기를 드롭아웃을 통해 분류기이자 경계 민감한 비판기로 작동하는 분류기 C로 대체한다.
- 두 개의 드롭아웃에 의해 유도된 분류기 C1과 C2를 사용하여 p(y|x)의 경계 섭동에 대한 민감도를 측정한다; 타깃 샘플에 대해 이 민감도를 최대화하고 생성기 출력에 대해 최소화한다.
- 타깃 데이터의 드롭아웃 민감도를 최소화하여 결정 경계에서 벗어난 타깃 특징을 생성하도록 G(특징 생성기)를 학습시킨다.
- 소스 데이터에서 판별력을 유지하면서 타깃 민감도를 최대화하도록 C를 학습하고 소스 감독 용어를 사용한다.
- 타깃 특징에 대한 균일한 클래스 분포를 촉진하기 위해 조건부 엔트로피 항을 포함한다.
- 실제 비라벨 데이터와 생성 데이터를 정렬시키는 동시에 C를 속이도록 G가 이미지를 생성하도록 하여 ADR을 반지도 GAN 학습으로 확장한다.
실험 결과
연구 질문
- RQ1타깃 라벨이 없더라도 드롭아웃 기반의 경계 인식 비판기가 소스와 타깃 특징의 정렬을 개선할 수 있는가?
- RQ2타깃 샘플에서 드롭아웃 유도 섭동에 대한 민감도를 최대로 하는 것이 구분 가능하고 경계가 없는 타깃 표현으로 이어지는가?
- RQ3도메인 시프트 하에서 ADR은 이미지 분류와 시맨틱 분할 모두에 효과적인가?
- RQ4생성 샘플을 결정 경계에서 멀리 배치하면서 생성 데이터가 실제 데이터와 유사하게 유지되도록 하여 ADR이 반지도 GAN 학습을 향상시킬 수 있는가?
주요 결과
- ADR은 이전 분포 일치 방법과 비교하여 숫자 데이터(MNIST/SVHN/USPS) 및 이미지 분할 작업에서 비지도 도메인 적응을 향상시킨다.
- SVHN에서 MNIST로의 전이에서 ADR은 보고된 실험에서 이전 방법보다 현저히 더 높은 정확도를 달성한다.
- ADR은 타깃 엔트로피를 감소시키고 타깃 샘플을 결정 경계에서 멀리 이동시키는 반면, 경계 민감성 없이 학습된 변형 분류기 C′는 여전히 경쟁력을 유지한다.
- ResNet101 및 ResNeXt 미세조정에 대해 VisDA2017 분류(합성 → 실제)에서 ADR이 최첨단 결과를 달성한다.
- 세분화(GTA5 → Cityscapes)에서 ADR은 소스-전용 및 타 경쟁 방법들보다 평균 IoU를 향상시킨다.
- ADR은 반지도 학습용 GAN 학습에 사용될 수 있으며 SVHN 및 CIFAR-10에서 경쟁력 있는 성과를 달성한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.