QUICK REVIEW

[논문 리뷰] Few-Shot Learning with Graph Neural Networks

Víctor García, Joan Bruna|arXiv (Cornell University)|2017. 11. 10.

Domain Adaptation and Few-Shot Learning참고 문헌 25인용 수 437

한 줄 요약

이 논문은 few-shot 학습을 이미지 모음으로 구성된 완전 연결 그래프 위의 감독된 보간으로 해석하고, 학습된 edge features를 갖는 그래프 신경망(GNN)을 사용해 레이블 정보를 전파한다.

ABSTRACT

We propose to study the problem of few-shot learning with the prism of inference on a partially observed graphical model, constructed from a collection of input images whose label can be either observed or not. By assimilating generic message-passing inference algorithms with their neural-network counterparts, we define a graph neural network architecture that generalizes several of the recently proposed few-shot learning models. Besides providing improved numerical performance, our framework is easily extended to variants of few-shot learning, such as semi-supervised or active learning, demonstrating the ability of graph-based models to operate well on 'relational' tasks.

연구 동기 및 목표

입력 이미지로 구성된 부분적으로 관찰된 그래프 모델에서의 추론으로 few-shot 학습에 동기를 부여한다.
레이블이 지정된 이미지와 레이블이 없는 이미지 집합 전반에 걸쳐 레이블 정보를 전파하는 방법을 학습하는 그래프 신경망(GNN) 프레임워크를 제안한다.
Omniglot과 Mini-Imagenet에서 적은 매개변수로 GNN이 state-of-the-art에 근접하거나 이를 상회함을 보인다.
프레임워크를 준지도 학습 및 활성 학습 시나리오로 확장하는 것을 시연한다.

제안 방법

노드는 이미지이고 엣지는 학습가능한 유사도 커널을 통해 학습되는 완전 연결 그래프로 이미지 모음을 표현한다.
메시지 패싱을 수행하는 계층을 갖춘 그래프 신경망을 사용하여 노드 특징과 학습된 엣지 특징을 모두 통합한다(Eq. 2 및 Eq. 3–4).
CNN으로 이미지를 임베딩하고 알려진 레이블을 원-핫 벡터로 연결하여 노드 특징을 초기화한다; 레이블이 없는 노드는 클래스 레이블에 대한 균일 사전을 사용한다.
최종 노드 표현에 대한 Softmax를 통해 질의 노드의 레이블을 예측하도록 엔드-투-엔드로 학습한다.
균일한 레이블 사전을 가진 unlabeled 노드를 포함시켜 준지도 학습으로 프레임워크를 확장하고, 어떤 unlabeled 노드를 질의할지 학습하여 활성 학습으로 확장한다( unlabeled 노드에 대한 Softmax 주의).
Siamese, Prototypical, 및 Matching Networks를 그래프 기반 메시지 패싱의 특수한 경우로 관련지힌다.

실험 결과

연구 질문

RQ1학습 가능한 엣지 특징을 갖는 그래프에서의 추론으로 few-shot 학습을 효과적으로 프레이밍하고 이를 GNN으로 엔드-투-엔드 학습할 수 있는가?
RQ2GNN 방식이 기존 방법들보다 파라미터 수를 줄이면서 표준 few-shot 벤치마크에서 경쟁력 있는 정확도를 달성하는가?
RQ3모델이 학습 목적의 근본적 변경 없이 준지도 및 활성 학습 설정으로 자연스럽게 확장될 수 있는가?
RQ4학습된 엣지 피처 인접성 학습이 고정된 유사도 지표와 레이블 정보를 전파하는 데에 얼마나 비교되는가?
RQ5밀집하고 완전 연결된 그래프에서 메시지 패싱의 깊이가 few-shot 작업의 성능에 미치는 영향은 무엇인가?

주요 결과

GNN 방식은 Omniglot 및 Mini-Imagenet에서 경쟁력 있는 정확도를 달성하며, 상당히 적은 수의 파라미터로 여러 state-of-the-art 방법들과 일치하거나 능가한다.
모델은 단일 그래프 기반 프레임워크 안에서 few-shot, 준지도, 활성 학습을 통합한다.
준지도 실험은 레이블이 없는 데이터가 성능을 크게 향상시킬 수 있으며, 때로는 더 적은 레이블 샘플로도 더 높은 레이블 설정과 유사하게 된다.
활성 학습 실험은 학습된 질의 전략이 Mini-Imagenet과 Omniglot에서 무작위 라벨링보다 성능이 낫고 정확도를 향상시킨다.
아키텍처는 그래프 기반 메시지 패싱의 특수한 경우로서 기존의 여러 Few-shot 모델(Siamese, Prototypical, Matching Networks)을 일반화한다.
이 방법은 입력 집합에 대해 엔드-투-엔드로 학습 가능하고 순열 불변성을 가진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.