[논문 리뷰] Pseudo-Labeling Curriculum for Unsupervised Domain Adaptation
본 논문은 PCDA를 제안하는데, 이는 density 기반 클러스터링을 통해 쉬운 샘플에서 어려운 샘플로 신뢰할 수 있는 대상 샘플을 선택하고, 여기에 클러스터링 제약을 더한 의사 라벨링 커리큘럼으로 무감독 도메인 적응을 수행하며, Office-31, imageCLEF-DA, Office-Home에서 최첨단 성능을 달성한다.
To learn target discriminative representations, using pseudo-labels is a simple yet effective approach for unsupervised domain adaptation. However, the existence of false pseudo-labels, which may have a detrimental influence on learning target representations, remains a major challenge. To overcome this issue, we propose a pseudo-labeling curriculum based on a density-based clustering algorithm. Since samples with high density values are more likely to have correct pseudo-labels, we leverage these subsets to train our target network at the early stage, and utilize data subsets with low density values at the later stage. We can progressively improve the capability of our network to generate pseudo-labels, and thus these target samples with pseudo-labels are effective for training our model. Moreover, we present a clustering constraint to enhance the discriminative power of the learned target features. Our approach achieves state-of-the-art performance on three benchmarks: Office-31, imageCLEF-DA, and Office-Home.
연구 동기 및 목표
- 비지도 설정에서 대상 샘플을 구분할 수 있는 표현을 학습하기 위해 공변량 시프트를 해결한다.
- 대상 학습에서 잘못된 의사 라벨의 악영향을 완화한다.
- 클러스터링 밀도에 기반해 쉬운 샘플부터 어려운 샘플까지 점진적으로 대상 샘플을 포함하는 커리큘럼을 도입한다.
- 학습 중 클러스터링 제약을 통해 대상 특징의 판별력을 향상시킨다.
제안 방법
- 소스 분류기 Cs와 대상 분류기 Ct를 갖춘 공유 특징 추출기 Gf를 사용하고, DANN 유사한 대립 학습에서 도메인 판별기 Gd를 추가한다.
- 예측된 각 클래스별 대상 특징에 밀도 기반 클러스터링을 적용해 대상 샘플을 쉬움 De, 보통 Dm, 어려움 Dh의 하위집합으로 형성한다.
- 쉬운 것에서 어려운 것 순으로 네 단계로 학습: 소스 데이터와 비라벨 대상부터 시작하고 (Ct는 학습되지 않음), 이후 De를 점진적으로 추가하고, 그다음 Dm, 마지막으로 Dh를 Ct와 함께 학습한다.
- 클러스터링 밀도를 사용해 대상 샘플의 순위를 매기고 Ct 학습용 데이터 하위집합을 형성하는 의사 라벨링 커리큘럼을 정의한다.
- 같은 클래스의 대상 샘플을 모으고 다른 클래스의 샘플을 멀어지게 하는 Euclidean 기반 대조 손실(ECL)을 통한 클러스터링 제약을 도입한다.
- 새로 추가된 샘플에 대한 베타 가중치를 포함하여 감독 손실, 도메인 대립 손실, 커리큘럼 기반 항들을 결합한 미니맥스 목표를 최적화한다.
실험 결과
연구 질문
- RQ1대상 샘플의 의사 라벨이 커리큘럼에 의해 억제되면 비지도 도메인 적응에서 효과적으로 사용될 수 있는가?
- RQ2도메인 적응에서 대상 샘플에 대한 밀도 기반 클러스터링이 쉬움에서 어려움으로의 신뢰할 수 있는 커리큘럼을 제공하는가?
- RQ3클러스터링 제약을 추가하면 의사 라벨이 있을 때 대상 특징의 판별력이 향상되는가?
- RQ4PCDA는 표준 벤치마크에서 최첨단의 비지도 도메인 적응 방법과 비교하여 어떤 성능을 보이는가?
주요 결과
- PCDA는 세 벤치마크(Office-31, imageCLEF-DA, Office-Home)에서 최첨단 또는 경쟁력 있는 평균 정확도를 달성한다.
- 밀도 기반 클러스터링을 이용한 의사 라벨링 커리큘럼은 쉬운 샘플에서 먼저 학습하고 점차 더 어려운 샘플을 도입함으로써 잘못된 의사 라벨의 영향을 줄인다.
- 클러스터링 제약(ECL)을 도입하면 대상 특징의 판별력이 향상되고 제약을 적용하지 않을 때보다 성능이 더 좋아진다.
- 하이퍼파라미터 분석에서 beta 값이 2에서 3 사이이고 군집 수 P가 약 3일 때 벤치마크 전반에서 강력한 결과를 보였다.
- 추가 분석에서 클러스터링 제약은 Office-31과 imageCLEF-DA의 성능을 향상시키는 반면, Office-Home의 경우 태스크와 미니 배치 크기에 따라 혼합된 효과를 보였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.