QUICK REVIEW

[논문 리뷰] Confidence Regularized Self-Training

Yang Zou, Zhiding Yu|arXiv (Cornell University)|2019. 08. 26.

Domain Adaptation and Few-Shot Learning참고 문헌 63인용 수 33

한 줄 요약

CRST는 소프트 가짜 라벨과 출력-평활 정규화를 사용하여 자가 학습의 비지도 도메인 적응을 개선하고, 여러 벤치마크에서 최첨단 결과를 달성합니다.

ABSTRACT

Recent advances in domain adaptation show that deep self-training presents a powerful means for unsupervised domain adaptation. These methods often involve an iterative process of predicting on target domain and then taking the confident predictions as pseudo-labels for retraining. However, since pseudo-labels can be noisy, self-training can put overconfident label belief on wrong classes, leading to deviated solutions with propagated errors. To address the problem, we propose a confidence regularized self-training (CRST) framework, formulated as regularized self-training. Our method treats pseudo-labels as continuous latent variables jointly optimized via alternating optimization. We propose two types of confidence regularization: label regularization (LR) and model regularization (MR). CRST-LR generates soft pseudo-labels while CRST-MR encourages the smoothness on network output. Extensive experiments on image classification and semantic segmentation show that CRSTs outperform their non-regularized counterpart with state-of-the-art performance. The code and models of this work are available at https://github.com/yzou2/CRST.

연구 동기 및 목표

무지도 도메인 적응을 촉진하고 자기 학습에서 노이즈가 있는 가짜 라벨을 다루는 것.
원-핫(one-hot) 가정의 완화를 위한 연속적 가짜 라벨 프레임워크를 도입한다.
훈련의 안정화를 위한 두 가지 정규화 패러다임(라벨 정규화와 모델 정규화)을 제안한다.
CRST를 정규화된 최대우도 추정 및 EM과 이론적으로 연관시킨다.
이미지 분류 및 의미 분할 벤치마크에서 CRST를 실증적으로 검증한다.

제안 방법

대상 도메인에서 CBST를 연속적 가짜 라벨로 일반화한다.
Soft 가짜 라벨과 음의 엔트로피 제약(LRENT)으로 라벨 정규화(LR)를 도입한다.
출력-스무딩 항(MR)으로 모델 정규화(MR)를 도입한다(MRL2, MRENT, MRKLD).
가짜 라벨 생성과 네트워크 재학습의 교대 단계로 최적화한다.
정규화 항의 닫힌 형식 해나 그래디언트를 제시하고 LRENT를 temperature를 가진 softmax와 연결한다.
다수의 데이터셋에서 CRST 변형이 CBST를 능가함을 보여준다.

실험 결과

연구 질문

RQ1무지도 도메인 적응에서 연속적 가짜 라벨이 자가 학습의 안정성 및 정확도를 향상시킬 수 있는가?
RQ2라벨 및 모델 정규화가 잘못된 가짜 라벨로 인한 오류 전이를 감소시키는가?
RQ3CRST 정규화가 알려진 확률적/softmax 형태와 어떤 관계가 있는가?
RQ4어떤 정규화가 시각적 작업 전반에서 최상의 성능을 제공하는가?
RQ5CRST가 분류 및 세그멘테이션 벤치마크에 미치는 실험적 영향은 무엇인가?

주요 결과

CRST 변형이 비정규화 CBST 기준선보다 벤치마크 전반에서 우수한 성능을 보인다.
MRKLD와 LRENT가 단일 정규화 중에서 최상의 혹은 경쟁력 있는 결과를 자주 제공한다.
MRKLD와 LRENT의 결합이 VisDA17 및 Office-31에서 추가 개선점을 가져온다.
CRST가 GTA5→Cityscapes 및 SYNTHIA→Cityscapes에서 DeepLabv2 및 기타 백본 아래 최첨단 성능을 달성한다.
소프트 가짜 라벨과 출력-평활 정규화는 과도한 확신 오류를 감소시키고 도메인 적응 성능을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.