QUICK REVIEW

[논문 리뷰] Free Lunch for Few-shot Learning: Distribution Calibration

Shuo Yang, Lu Liu|arXiv (Cornell University)|2021. 01. 16.

Domain Adaptation and Few-Shot Learning참고 문헌 34인용 수 174

한 줄 요약

이 논문은 파라미터 없이 간단한 분포 보정 전략을 제시하여 베이스 클래스의 통계를 몇-shot 신규 클래스의 특징 공간으로 전달하고, 샘플링된 특징이 분류자 학습을 개선하게 합니다. 이러한 보정된 특징으로 학습된 로지스틱 회귀 모델은 여러 데이터 세트에서 최첨단 성능을 달성합니다.

ABSTRACT

Learning from a limited number of samples is challenging since the learned model can easily become overfitted based on the biased distribution formed by only a few training examples. In this paper, we calibrate the distribution of these few-sample classes by transferring statistics from the classes with sufficient examples, then an adequate number of examples can be sampled from the calibrated distribution to expand the inputs to the classifier. We assume every dimension in the feature representation follows a Gaussian distribution so that the mean and the variance of the distribution can borrow from that of similar classes whose statistics are better estimated with an adequate number of samples. Our method can be built on top of off-the-shelf pretrained feature extractors and classification models without extra parameters. We show that a simple logistic regression classifier trained using the features sampled from our calibrated distribution can outperform the state-of-the-art accuracy on two datasets (~5% improvement on miniImageNet compared to the next best). The visualization of these generated features demonstrates that our calibrated distribution is an accurate estimation.

연구 동기 및 목표

few-shot 학습에서 특징 공간 분포의 과적합 및 편향을 많은-shot 베이스 클래스의 통계로 보정하여 해결한다.
Gaussian-feature-model 기반 전이 메커니즘을 제안하여 신규 클래스의 보정 평균 및 공분산을 추정한다.
Tukey의 Ladder of Powers 변환으로 특징을 가우시안화하고 추가 학습 파라미터 없이 증강 샘플을 생성한다.
보정된 샘플로 학습된 간단한 로지스틱 회귀(또는 선형 분류기)가 최첨단 방법을 능가함을 입증한다.
추가 파라미터 학습 없이 다중 데이터 세트와 백본에서 방법의 강인성을 보여준다.

제안 방법

각 특징 차원이 클래스마다 가우시안 분포를 따른다고 가정하고 클래스 간 유사도에 따라 베이스 클래스 통계를 신규 클래스에 전달한다.
보정 전에 Tukey의 Ladder of Powers 변환으로 특징을 가우시안화한다.
각 서포트 피처에 대해 평균 거리 기준으로 k개의 이웃 베이스 클래스를 식별하고 해당 샘플에 대한 보정 평균 및 공분산을 계산한다.
가장 가까운 베이스 통계로부터 신규 클래스의 보정된 분포 집합을 구성하고 이 분포들로부터 추가 특징을 샘플링한다.
원래의(변환된) 서포트 특징과 생성된 특징 모두에 대해 교차 엔트로피 손실로 분류기를 학습한다; 새로운 학습 가능한 파라미터는 도입되지 않는다.

실험 결과

연구 질문

RQ1분포 보정이 추가 학습 파라미터 없이도 분포 편향을 완화하여 few-shot 학습을 개선할 수 있는가?
RQ2특징 공간 가우시안 가정으로 베이스 클래스 통계가 신규 클래스에 얼마나 잘 전달될 수 있는가?
RQ3Tukey 변환과 생성 샘플의 수가 few-shot 정확도에 어떤 영향을 주는가?
RQ4제안된 방법이 서로 다른 데이터 세트와 백본에서 어떻게 성능을 발휘하는가?
RQ5보정되고 증강된 특징에 대해 간단한 선형 분류기가 충분한가?

주요 결과

보정된 특징으로 simple classifier를 사용한 mini ImageNet, tiered ImageNet, CUB에서 5-way 1-shot 및 5-shot 정확도 향상
보정된 분포가 테스트 분포를 더 잘 커버하는 특징을 생성하며 이는 시각화 및 정확도 향상으로 확인
보정되고 증강된 특징으로 학습된 로지스틱 회귀 또는 SVM이 다수의 최첨단 방법을 능가하면서도 추가 학습 파라미터가 필요하지 않음
Tukey의 변환(λ 약 0.5)과 생성된 특징을 조합하면 가장 좋은 바리에이션 성능을 얻음
보정은 백본에 강건하며 다양한 베이스라인 위에 적용하여 성능을 높일 수 있음

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.