[논문 리뷰] Confidence Regularized Self-Training
CRST는 소프트 가짜 라벨과 출력-평활 정규화를 사용하여 자가 학습의 비지도 도메인 적응을 개선하고, 여러 벤치마크에서 최첨단 결과를 달성합니다.
Recent advances in domain adaptation show that deep self-training presents a powerful means for unsupervised domain adaptation. These methods often involve an iterative process of predicting on target domain and then taking the confident predictions as pseudo-labels for retraining. However, since pseudo-labels can be noisy, self-training can put overconfident label belief on wrong classes, leading to deviated solutions with propagated errors. To address the problem, we propose a confidence regularized self-training (CRST) framework, formulated as regularized self-training. Our method treats pseudo-labels as continuous latent variables jointly optimized via alternating optimization. We propose two types of confidence regularization: label regularization (LR) and model regularization (MR). CRST-LR generates soft pseudo-labels while CRST-MR encourages the smoothness on network output. Extensive experiments on image classification and semantic segmentation show that CRSTs outperform their non-regularized counterpart with state-of-the-art performance. The code and models of this work are available at https://github.com/yzou2/CRST.
연구 동기 및 목표
- 무지도 도메인 적응을 촉진하고 자기 학습에서 노이즈가 있는 가짜 라벨을 다루는 것.
- 원-핫(one-hot) 가정의 완화를 위한 연속적 가짜 라벨 프레임워크를 도입한다.
- 훈련의 안정화를 위한 두 가지 정규화 패러다임(라벨 정규화와 모델 정규화)을 제안한다.
- CRST를 정규화된 최대우도 추정 및 EM과 이론적으로 연관시킨다.
- 이미지 분류 및 의미 분할 벤치마크에서 CRST를 실증적으로 검증한다.
제안 방법
- 대상 도메인에서 CBST를 연속적 가짜 라벨로 일반화한다.
- Soft 가짜 라벨과 음의 엔트로피 제약(LRENT)으로 라벨 정규화(LR)를 도입한다.
- 출력-스무딩 항(MR)으로 모델 정규화(MR)를 도입한다(MRL2, MRENT, MRKLD).
- 가짜 라벨 생성과 네트워크 재학습의 교대 단계로 최적화한다.
- 정규화 항의 닫힌 형식 해나 그래디언트를 제시하고 LRENT를 temperature를 가진 softmax와 연결한다.
- 다수의 데이터셋에서 CRST 변형이 CBST를 능가함을 보여준다.
실험 결과
연구 질문
- RQ1무지도 도메인 적응에서 연속적 가짜 라벨이 자가 학습의 안정성 및 정확도를 향상시킬 수 있는가?
- RQ2라벨 및 모델 정규화가 잘못된 가짜 라벨로 인한 오류 전이를 감소시키는가?
- RQ3CRST 정규화가 알려진 확률적/softmax 형태와 어떤 관계가 있는가?
- RQ4어떤 정규화가 시각적 작업 전반에서 최상의 성능을 제공하는가?
- RQ5CRST가 분류 및 세그멘테이션 벤치마크에 미치는 실험적 영향은 무엇인가?
주요 결과
- CRST 변형이 비정규화 CBST 기준선보다 벤치마크 전반에서 우수한 성능을 보인다.
- MRKLD와 LRENT가 단일 정규화 중에서 최상의 혹은 경쟁력 있는 결과를 자주 제공한다.
- MRKLD와 LRENT의 결합이 VisDA17 및 Office-31에서 추가 개선점을 가져온다.
- CRST가 GTA5→Cityscapes 및 SYNTHIA→Cityscapes에서 DeepLabv2 및 기타 백본 아래 최첨단 성능을 달성한다.
- 소프트 가짜 라벨과 출력-평활 정규화는 과도한 확신 오류를 감소시키고 도메인 적응 성능을 향상시킨다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.