Skip to main content
QUICK REVIEW

[논문 리뷰] Uncertainty Modeling for Out-of-Distribution Generalization

Xiaotong Li, Yongxing Dai|arXiv (Cornell University)|2022. 02. 08.
Domain Adaptation and Few-Shot Learning인용 수 71
한 줄 요약

DSU를 도입하는 확률적 접근법으로, 특징 통계를 불확실한 분포로 다룸으로써 도메인 변화에 대응하고 추가 매개변수 없이 비전 과제 전반에서 일반화를 향상시킵니다.

ABSTRACT

Though remarkable progress has been achieved in various vision tasks, deep neural networks still suffer obvious performance degradation when tested in out-of-distribution scenarios. We argue that the feature statistics (mean and standard deviation), which carry the domain characteristics of the training data, can be properly manipulated to improve the generalization ability of deep learning models. Common methods often consider the feature statistics as deterministic values measured from the learned features and do not explicitly consider the uncertain statistics discrepancy caused by potential domain shifts during testing. In this paper, we improve the network generalization ability by modeling the uncertainty of domain shifts with synthesized feature statistics during training. Specifically, we hypothesize that the feature statistic, after considering the potential uncertainties, follows a multivariate Gaussian distribution. Hence, each feature statistic is no longer a deterministic value, but a probabilistic point with diverse distribution possibilities. With the uncertain feature statistics, the models can be trained to alleviate the domain perturbations and achieve better robustness against potential domain shifts. Our method can be readily integrated into networks without additional parameters. Extensive experiments demonstrate that our proposed method consistently improves the network generalization ability on multiple vision tasks, including image classification, semantic segmentation, and instance retrieval. The code can be available at https://github.com/lixiaotong97/DSU.

연구 동기 및 목표

  • unseen 도메인 이동에 대한 강건성 확보를 위해 불확실한 특징 통계 활용
  • 특징 평균과 분산을 가우시안 분포로 모델링하는 확률적 공식 제안
  • 다양한 도메인 이동을 시뮬레이션하기 위한 샘플링된 특징 통계로 훈련 시 증강 가능
  • 기존 네트워크에 삽입 가능한 파라미터 없이의 통합 유지
  • 여러 비전 과제에서 일반화 향상 시연

제안 방법

  • 특징 통계(평균 및 표준편차)를 원래 값에 중심을 둔 다변량 가우시안으로 모델링
  • 비모수적 미니배치 분산을 통해 채널별 불확실성 범위 추정
  • 재매개화 트릭으로 N(original, scope^2)에서 새로운 통계 샘플링하여 역전파 가능
  • 훈련 중 AdaIN 유사 모듈로 샘플링된 통계로 원래 통계 교체
  • 훈련 중 DSU 적용 빈도를 제어하는 확률 p 도입(훈련 전용, 테스트 시 오버헤드 없음)
  • 추가 파라미터나 손실 없이 네트워크의 다양한 위치에서 플러그 앤 플레이식 통합 시연

실험 결과

연구 질문

  • RQ1학습 시점에 보지 못한 도메인 이동에 대한 불확실한 특징 통계가 강건성 향상에 기여하는가?
  • RQ2확률적 특징 통계 증강이 결정론적 통계 기반 방법보다 다양한 과제에서 일반화에 더 나은가?
  • RQ3DSU가 기존의 도메인 일반화 방법 및 이미지 수준 증강과 어떤 상호작용을 보이는가?
  • RQ4최적의 이득을 위해 네트워크 어디에 DSU 모듈을 삽입해야 하는가?

주요 결과

  • DSU는 PACS의 다중 도메인 분류에서 강력한 결정론적 기준선보다 일반화 성능을 일관되게 향상시켰다.
  • DSU는 평균 정확도 및 도메인별 성능에서 여러 선행 스타일/통계 기반 방법(MixStyle, pAdaIN 등)보다 우수한 성능을 보였다.
  • 시맨틱 분할(GTA5 → Cityscapes)에서 DSU는 기준선 대비 눈에 띄는 mIOU 및 mAcc 향상을 보였다(예: +6.1% mIOU, +5.5% mAcc).
  • 인스턴스 검색(Duke-Market 데이터셋)에서 DSU는 기준선 대비 mAP 및 R1에서 큰 개선을 달성했다(예: 약 +6–7 포인트).
  • DSU는 ImageNet-C의 잡힘에 대한 강인성을 향상시키고 최첨단 방법(APR)을 보완할 수 있다.
  • 추가 분석은 DSU의 이득이 삽입 위치에 관계없이 유지되며 시도된 분포의 혼합에 대해 상대적으로 강건함을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.