QUICK REVIEW

[논문 리뷰] Adaptive Posterior Learning: few-shot learning with a surprise-based memory module

Tiago Ramalho, Marta Garnelo|arXiv (Cornell University)|2019. 02. 07.

Domain Adaptation and Few-Shot Learning인용 수 42

한 줄 요약

APL은 외부 메모리에 가장 놀라운 관측만 저장하고 후방 분포를 추론하기 위해 관계 디코더를 사용하는 몇-샷 학습 방법으로, 더 작은 메모리 사용량으로 경쟁력 있는 정확도를 달성하며 수천 개의 클래스에 확장 가능합니다.

ABSTRACT

The ability to generalize quickly from few observations is crucial for intelligent systems. In this paper we introduce APL, an algorithm that approximates probability distributions by remembering the most surprising observations it has encountered. These past observations are recalled from an external memory module and processed by a decoder network that can combine information from different memory slots to generalize beyond direct recall. We show this algorithm can perform as well as state of the art baselines on few-shot classification benchmarks with a smaller memory footprint. In addition, its memory compression allows it to scale to thousands of unknown labels. Finally, we introduce a meta-learning reasoning task which is more challenging than direct classification. In this setting, APL is able to generalize with fewer than one example per class via deductive reasoning.

연구 동기 및 목표

저장된 과거 경험을 사용하여 후방 분포를 근사함으로써 몇-샷 학습을 가능하게 한다.
메모리에 매우 놀라운 예시만 기록하여 메모리 사용량을 최소화한다.
실제 메모리(working memory)와 외부 메모리를 결합하고 관계 디코더를 통해 확장 가능한 추론을 가능하게 한다.
전체 시퀀스를 역전파하지 않고 온라인에서 후방 분포 업데이트를 근사하도록 트레이닝한다.

제안 방법

인코더는 각 입력에 대한 표현을 생성한다.
외부 메모리는 선택된 (임베딩, 라벨) 쌍을 저장하며 쓰기는 놀람 기반 메커니즘에 의해 제어된다.
메모리는 k-최근접 이웃을 통해 질의되어 관련된 과거 관찰을 검색한다.
디코더(관계형 자기 주의, 관계형 워킹 메모리 또는 LSTM)는 질의 임베딩과 메모리 이웃을 사용하여 클래스 로짓을 생성한다.
메모리 쓰기는 놀람 S = -log(y_t)를 사용한다; S > sigma일 때 기록하며, sigma는 클래스 N에 대해 ~ -log(N)이다.
각 타임스텝에서의 학습 업데이트는 전체 시퀀스를 역전파하지 않고 교차 엔트로피 손실을 최소화하며, 에피소드 데이터가 온라인 적응을 주도한다.

실험 결과

연구 질문

RQ1APL이 에피소드 중 최소한의 메모리와 온라인 업데이트로 후방 분포 업데이트를 근사할 수 있는가?
RQ2놀람 기반 메모리 쓰기가 몇-샷 작업에서 메모리 효율성과 정확도에 어떤 영향을 미치는가?
RQ3관계형 디코딩 아키텍처가 회상된 메모리에 대해 효과적인 비자명 추론을 가능하게 하는가?
RQ4실제 데이터셋에서 수천 개의 클래스에 대해 APL은 얼마나 잘 확장되는가?
RQ5표준 분류를 넘어 메타 러닝 스타일의 추론 과제에 APL이 일반화될 수 있는가?

주요 결과

APL은 기준치들보다 더 작은 메모리 점유로 경쟁력 있는 몇-샷 분류 정확도를 달성한다.
메모리 컨트롤러는 매우 놀란 관찰만 기록하여 희소하고 과제 관련 메모리 사용을 이끈다.
외부 메모리와 관계형 디코더는 확장 가능한 추론을 가능하게 하고 검색된 항목들 간의 모두 대 모두 주의를 지원한다.
사전 학습된 인코더를 사용하여 ImageNet에서 수천 개의 클래스에 확장하며 20/100/1000-way 작업에서 높은 top-1 정확도를 달성한다.
전용 수-비교 추론 과제에서 APL은 일부 설정에서 클래스당 예시가 1개 미만으로도 강력한 일반화를 달성하여 연역적 추론과 유사한 능력을 보임을 시연한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.