Skip to main content
QUICK REVIEW

[논문 리뷰] Recognition in Unseen Domains: Domain Generalization via Universal Non-volume Preserving Models.

Thanh-Dat Truong, Chi Nhan Duong|arXiv (Cornell University)|2019. 05. 28.
Domain Adaptation and Few-Shot Learning참고 문헌 23인용 수 2
한 줄 요약

이 논문은 딥러닝에서 도메인 일반화를 위한 유니버설 비체적보존(NVP) 모델을 제안하며, 미세조정 없이도 예측 불가능한 도메인에서도 인식이 가능하게 한다. 정규화 플로우를 통해 도메인에 영향을 받지 않는 표현을 학습함으로써, MNIST, 얼굴 인식, 열화상 보행자 인식을 포함한 다양한 데이터셋에서 일관된 정확도 향상을 달성한다.

ABSTRACT

Recognition across domains has recently become an active topic in the research community. However, it has been largely overlooked in the problem of recognition in new unseen domains. Under this condition, the delivered deep network models are unable to be updated, adapted or fine-tuned. Therefore, recent deep learning techniques, such as: domain adaptation, feature transferring, and fine-tuning, cannot be applied. This paper presents a novel approach to the problem of domain generalization in the context of deep learning. The proposed method is evaluated on different datasets in various problems, i.e. (i) digit recognition on MNIST, SVHN and MNIST-M, (ii) face recognition on Extended Yale-B, CMU-PIE and CMU-MPIE, and (iii) pedestrian recognition on RGB and Thermal image datasets. The experimental results show that our proposed method consistently improves the performance accuracy. It can be also easily incorporated with any other CNN frameworks within an end-to-end deep network design for object detection and recognition problems to improve their performance.

연구 동기 및 목표

  • 모델 업데이트나 미세조정이 허용되지 않는 예측 불가능한 도메인의 데이터를 인식하는 문제에 대응한다.
  • 도메인 특화 적응에 의존하지 않고 다양한 데이터 분포 간에 일반화되는 도메인 일반화 방법을 개발한다.
  • 알 수 없는 또는 예측 불가능한 도메인 이동이 발생하는 실세계 시나리오에 딥러닝 모델을 구현할 수 있도록 한다.
  • 객체 검출 및 인식 작업에 대한 엔드 투 엔드 통합을 위해 기존의 CNN 프레임워크와의 호환성을 확보한다.

제안 방법

  • 다양한 도메인 간에 도메인에 영향을 받지 않는 특징 표현을 학습하기 위해 유니버설 비체적보존(NVP) 플로우를 활용한다.
  • 정규화 플로우를 적용하여 복잡한 비선형 변환을 모델링하면서도 역행과 가능도 계산 능력을 유지한다.
  • 모델을 엔드 투 엔드로 훈련하여 도메인 특화된 변형을 공통의 불변 특징에서 분리한다.
  • 기존의 인식 파이프라인에 원활하게 통합할 수 있도록 표준 CNN 백본과의 호환성을 설계한다.
  • 도메인 이동에 영향을 받지 않는 표현 학습 목표를 설계하여 특징이 도메인 이동에 대해 불변이 되도록 유도한다.
  • 재구성 손실과 도메인 불변성 정규화의 조합을 사용해 모델을 최적화한다.

실험 결과

연구 질문

  • RQ1유니버설 NVP 기반 모델이 미세조정이나 적응 없이도 예측 불가능한 도메인으로 효과적으로 일반화될 수 있는가?
  • RQ2제안된 방법은 숫자, 얼굴, 보행자 인식과 같은 다양한 인식 작업에서 어떻게 성능을 발휘하는가?
  • RQ3기존의 도메인 일반화 기준 기반 기법과 비교해 정확도 향상 정도는 어느 정도인가?
  • RQ4표준 CNN 아키텍처와의 통합이 엔드 투 엔드 인식 시스템에서 얼마나 잘 작동하는가?

주요 결과

  • 제안된 방법은 MNIST, SVHN, MNIST-M, Extended Yale-B, CMU-PIE, CMU-MPIE, RGB/TIR 보행자 데이터셋을 포함한 모든 평가된 데이터셋에서 일관된 정확도 향상을 달성한다.
  • 훈련 시 도메인 특화 데이터에 접근하지 못한 상태에서도 기존의 도메인 일반화 기법보다 뛰어난 성능을 발휘한다.
  • RGB와 열화상 이미지와 같은 교차 모odal 설정을 포함한 다양한 데이터 분포 간에도 강력한 일반화 능력을 보여준다.
  • 표준 CNN과 NVP 기반 모듈을 통합함으로써 엔드 투 엔드 인식 작업에서 측정 가능한 성능 향상을 이룬다.
  • 심각한 도메인 이동 상황에서도 강건성을 유지함으로써 도메인 불변 특징의 효과적인 분리가 이루어졌음을 시사한다.
  • 기존의 딥러닝 프레임워크와의 확장성과 호환성이 뛰어나 객체 검출 및 인식 작업에 쉽게 통합할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.