QUICK REVIEW

[논문 리뷰] Unsupervised Feature Learning by Cross-Level Discrimination between Instances and Groups

Xudong Wang, Ziwei Liu|arXiv (Cornell University)|2020. 08. 09.

Machine Learning and Data Classification참고 문헌 43인용 수 14

한 줄 요약

이 논문은 고도의 인스턴스 상관관계와 긴 꼬리 클래스 분포를 가진 실세계 데이터에서 비지도 특징 학습의 안정성을 높이기 위해 인스턴스와 그룹 간의 크로스레벨 차별화를 제안한다. 국소적 유인과 그룹 간 장거리 반발을 모두 활용하고, 별도의 특징 브랜치에서 그룹화와 차별화를 분리함으로써, 자기지도 및 준지도 벤치마크에서 최신 기술 수준의 성능을 달성하며, 안정성과 비퇴화 문제를 해결한다.

ABSTRACT

Unsupervised feature learning has made great strides with invariant mapping and instance-level discrimination, as benchmarked by classification on common datasets. However, these datasets are curated to be distinctive and class-balanced, whereas naturally collected data could be highly correlated within the class (with repeats at the extreme) and long-tail distributed across classes. The natural grouping of instances conflicts with the fundamental assumption of instance-level discrimination. Contrastive feature learning is thus unstable without grouping, whereas grouping without contrastive feature learning is easily trapped into degeneracy. We propose to integrate grouping into instance-level discrimination, not by imposing group-level discrimination, but by imposing cross-level discrimination between instances and groups. Our key insight is that grouping results from not just attraction, but also repulsion. While invariant mapping is achieved by local attraction between augmented instances, instance similarity emerges from long-range repulsion against common instance groups. To further avoid the clash between grouping and discrimination objectives, we also impose them on separate features derived from the common feature. Our extensive experimentation demonstrates not only significant gain on datasets with high correlation and long-tail distributions, but also leading performance on multiple self-supervision and semi-supervision benchmarks, bringing unsupervised feature learning closer to real data applications.

연구 동기 및 목표

고도의 인스턴스 상관관계와 긴 꼬리 클래스 분포를 가진 실세계 데이터에서 대비 기반 특징 학습의 불안정성을 해결하기 위해.
비지도 표현 학습에서 그룹화 목표와 인스턴스 수준의 차별화 간의 갈등을 해결하기 위해.
그룹 기반 방법에서의 퇄화를 방지하기 위해 그룹화와 차별화 목표를 분리하기 위해.
이dealized, 균형 잡힌 벤치마크에서 벗어난 데이터셋에서 비지도 특징 학습의 일반화를 향상시키기 위해.
명시적인 그룹 수준의 차별화를 부여하지 않고도 인스턴스 수준의 차별화에 그룹 수준의 구조를 통합하기 위해.

제안 방법

증강된 인스턴스 간 국소적 유인과 공통 인스턴스 그룹에 대한 장거리 반발을 결합한 크로스레벨 차별화를 도입하기 위해.
목표 갈등을 방지하기 위해 그룹화와 차별화를 위한 별도의 특징 브랜치로 특징 공간을 분리하기 위해.
데이터 증강에 따른 국소적 특징 일관성을 장려하기 위해 불변 매핑을 사용하기 위해.
공유된 그룹 표현으로부터의 반발을 통해 인스턴스 유사도를 모델링하여 그룹 간 특징의 독창성을 증진하기 위해.
차별화 브랜치에서는 대비 학습을 적용하고, 그룹화 브랜치에서는 클러스터링을 통해 그룹화를 수행하기 위해.
공유된 백본 특징을 활용하지만, 그룹화와 차별화 목표를 별도의 특징 스트림에서 독립적으로 적용하기 위해.

실험 결과

연구 질문

RQ1고도의 인스턴스 상관관계와 긴 꼬리 분포를 가진 데이터에서 비지도 특징 학습은 어떻게 안정화될 수 있는가?
RQ2국소적 유인을 넘어서 특징 차별화를 향상시키기 위해 인스턴스와 그룹 간의 반발은 어떤 역할을 하는가?
RQ3그룹화와 차별화 목표를 분리하면 자기지도 표현 학습에서의 퇴화를 방지할 수 있는가?
RQ4실세계 데이터에서 크로스레벨 차별화가 표준 인스턴스 수준 또는 그룹 수준의 대비 학습보다 어떻게 비교되는가?
RQ5제안된 방법은 자기지도 및 준지도 벤치마크 전반에서 얼마나 잘 일반화되는가?

주요 결과

고도의 인스턴스 상관관계와 긴 꼬리 분포를 가진 데이터셋에서 제안된 방법이 뚜렷한 성능 향상을 달성한다.
다양한 자기지도 벤치마크에서 표준 인스턴스 수준의 대비 학습 및 그룹 수준의 방법보다 뛰어난 성능을 보인다.
준지도 학습 벤치마크에서 최고 성능을 기록하여 강력한 일반화 능력을 보여준다.
그룹화와 차별화 목표를 분리함으로써 퇴화를 효과적으로 방지하고 학습 안정성을 향상시킨다.
공통 그룹에 대한 장거리 반발을 통합함으로써 국소적 불변성 이상의 특징 차별화 능력이 향상된다.
이dealized, 균형 잡힌 데이터셋에서 벗어난 실세계 데이터 분포로 잘 일반화된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.