QUICK REVIEW

[논문 리뷰] Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Yanbin Liu, Juho Lee|arXiv (Cornell University)|2018. 05. 25.

Domain Adaptation and Few-Shot Learning인용 수 486

한 줄 요약

TPN은 지지 집합과 질의 세트의 합집합에서 그래프를 학습하여 few-shot 학습을 위한 엔드투엔드 트랜스덕티브 라벨 전파를 도입하고, mini ImageNet 및 tiered ImageNet에서 최첨단 성능을 달성한다.

ABSTRACT

The goal of few-shot learning is to learn a classifier that generalizes well even when trained with a limited number of training instances per class. The recently introduced meta-learning approaches tackle this problem by learning a generic classifier across a large number of multiclass classification tasks and generalizing the model to a new task. Yet, even with such meta-learning, the low-data problem in the novel classification task still remains. In this paper, we propose Transductive Propagation Network (TPN), a novel meta-learning framework for transductive inference that classifies the entire test set at once to alleviate the low-data problem. Specifically, we propose to learn to propagate labels from labeled instances to unlabeled test instances, by learning a graph construction module that exploits the manifold structure in the data. TPN jointly learns both the parameters of feature embedding and the graph construction in an end-to-end manner. We validate TPN on multiple benchmark datasets, on which it largely outperforms existing few-shot learning approaches and achieves the state-of-the-art results.

연구 동기 및 목표

소량 샷 분류 문제를 해결하기 위해 전체 질의 세트에 대한 트랜스덕티브 추론을 활용하여 데이터 부족 문제를 완화하는 것을 동기로 한다.
특징 임베딩과 태스크 적응 그래프를 공동으로 학습하는 엔드투엔드 학습 가능한 프레임워크를 제안한다.
에피소딕 학습을 활용하여 테스트 조건을 시뮬레이션하고 라벨 전파 메커니즘을 최적화한다.
트랜스덕티브 그래프를 통한 라벨 전파 학습이 표준 벤치마크에서 inductive/meta-learning 기반보다 정확도를 향상시킨다는 것을 보여준다.

제안 방법

입력을 CNN으로 임베딩하여 특성 표현 f_phi(x)을 얻는다.
S ∪ Q의 모든 x_i에 대해 f_phi(x_i)에 적용된 그래프 구성 모듈 g_phi를 통해 예제-별 길이 스케일 그래프 매개변수 sigma_i를 구성한다.
개별 예제 스케일링된 임베딩으로 kNN 유사도 그래프 W를 계산하고 그래프 라플라시안 S = D^(-1/2) W D^(-1/2)으로 정규화한다.
지지 집합에서 질의 집합으로 라벨을 전파하기 위해 F* = (I - αS)^(-1) Y를 수행하고 Y는 알려진 라벨을 부호화한다.
전파된 점수 F* (softmaxed)와 지상 진실 라벨 사이의 교차 엔트로피를 최소화하여 S ∪ Q에서 φ와 φ를 역전파로 업데이트하며 엔드투엔드로 학습한다.
에피소드당 그래프 구성(N-way K-shot)은 태스크 매니폴드를 학습하도록 적응하도록 하고 복잡도는 n ≈ N×K + T로 작게 유지된다(예: 80–100).

실험 결과

연구 질문

RQ1에피소딕 메타러닝 프레임워크 내에서 학습된 트랜스덕티브 라벨 전파가 inductive 소수 샷 방법보다 더 우수한가?
RQ2예제-별 그래프의 확장성과 거리 학습이 새로운 클래스 공간에서의 라벨 전파를 개선하는가?
RQ3더 높은 샷 혹은 더 높은 방식의 학습 전략이 트랜스덕티브 소수 샷 성능에 어떤 영향을 미치는가?
RQ4표준 벤치마크(mini ImageNet, tiered ImageNet)에서 트랜스덕티브 전파가 최첨단 방법과 비교하여 어떤 성능을 보이는가?

주요 결과

5-웨이 1샷	5-웨이 5샷	10-웨이 1샷	10-웨이 5샷
53.75	69.43	36.62	52.32
55.51	69.86	38.44	52.77
57.53	72.85	40.93	59.17
59.91	73.30	44.80	59.44
52.31	68.18	35.23	51.24
53.75	69.43	36.62	52.32
55.51	69.86	38.44	52.77
57.53	72.85	40.93	59.17

TPN은 mini ImageNet 및 tiered ImageNet에서 최첨단 결과를 달성하고, inductive 및 다른 트랜스덕티브 기준선보다 우수하다.
라벨 전파를 위한 예제-별의 태스크 적응 그래프를 학습시키면 특히 1-shot 시나리오에서 상당한 이득이 있다.
더 많은 예제 수로의 학습(더 높은 샷)은 TPN 성능을 더욱 향상시키며 1-shot 설정에서 더 큰 이득을 준다.
반지도 학습 확장(TPN-semi)은 비교 가능한 반지도 소수 샷 기준선 대비 결과를 더 높인다.
레이블링된 데이터가 부족할 때 전체 질의 세트를 활용하는 트랜스덕티브 방법이 특히 유리하며, 라벨링 세트가 커질수록 수익이 감소한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.