Skip to main content
QUICK REVIEW

[논문 리뷰] Janossy Pooling: Learning Deep Permutation-Invariant Functions for Variable-Size Inputs

Ryan L. Murphy, Balasubramaniam Srinivasan|arXiv (Cornell University)|2018. 11. 05.
Machine Learning in Bioinformatics참고 문헌 46인용 수 65
한 줄 요약

논문은 순열-민감 함수의 출력을 모든 입력 순서에 대해 평균화하여 가변 크기 입력에 대한 순열 불변 함수를 학습하는 Janossy pooling을 소개하고, tractable 근사 및 학습 알고리즘을 제안한다.

ABSTRACT

We consider a simple and overarching representation for permutation-invariant functions of sequences (or multiset functions). Our approach, which we call Janossy pooling, expresses a permutation-invariant function as the average of a permutation-sensitive function applied to all reorderings of the input sequence. This allows us to leverage the rich and mature literature on permutation-sensitive functions to construct novel and flexible permutation-invariant functions. If carried out naively, Janossy pooling can be computationally prohibitive. To allow computational tractability, we consider three kinds of approximations: canonical orderings of sequences, functions with $k$-order interactions, and stochastic optimization algorithms with random permutations. Our framework unifies a variety of existing work in the literature, and suggests possible modeling and algorithmic extensions. We explore a few in our experiments, which demonstrate improved performance over current state-of-the-art methods.

연구 동기 및 목표

  • 입력 순서에 불변하고 가변 길이 입력을 지원하는 유연하고 학습 가능한 풀링 연산자를 개발한다.
  • 순열-민감 함수를 활용하여 강력한 순열-불변 신경망을 구성한다.
  • 실현 가능한 전략(정규 순서, k-ary 의존성, 순열 샘플링)을 제시하고 Janossy pooling 프레임워크 내에서 기존 방법들을 통합한다.
  • DeepSets와 de Finetti 교환가능성과 같은 기존 연구와의 연결을 분석하고 학습 역학을 연구한다.
  • Janossy pooling이 관련 작업에서 최첨단 baselines보다 성능을 향상시킨다는 것을 실증적으로 보여준다.

제안 방법

  • Janossy pooling을 모든 입력 순열에 대해 적용된 순열-민감 함수의 출력의 평균으로 정의한다.
  • 정규 입력 순서, k-ary 의존성, 순열 샘플링(pi-SGD)으로 구성된 세 가지 실현 가능성 접근법을 도입한다.
  • k-ary Janossy pooling이 합계를 순열의 부분집합으로 축소하여 계산을 줄임을 보인다.
  • 깊이 있는 표현력과 계산 간의 트레이드-오프를 논의하기 위해 1-ary Janossy pooling과 DeepSets 간의 연결 분석을 제공한다.
  • 순열-민감 모델을 훈련하기 위해 무작위 입력 순열을 샘플링하는 pi-SGD를 제안한다.
  • 학습된 Janossy 모델에 대한 추론 영향 및 분산 감소 아이디어를 논의한다.

실험 결과

연구 질문

  • RQ1가변 크기 입력에 대해 순열-불변 함수를 어떻게 유연하게 학습할 수 있는가?
  • RQ2표현력을 유지하면서 계산을 줄일 수 있는 Janossy pooling의 tractable 근사 방법은 무엇인가?
  • RQ3정규 순서화, k-ary 의존성, 순열 샘플링이 실제로 순열-불변 모델 학습에 어떤 차이가 있는가?
  • RQ4Janossy pooling, DeepSets, 그리고 유한한 de Finetti 교환가능성 사이에 어떤 이론적 연결이 있는가?
  • RQ5pi-SGD가 순열 기반 학습을 사용할 때 수렴 및 추론 면에서 어떤 거동을 보이는가?

주요 결과

  • Janossy pooling은 순열-민감한 구성요소로부터 순열-불변 네트워크를 구성하기 위한 통합 프레임워크를 제공한다.
  • 정규 순서, k-ary 의존성, 순열 샘플링의 세 가지 실현 가능성 전략과 표현력과 비용 간의 트레이드-오프를 제시한다.
  • k-ary Janossy pooling은 합계 대상의 감소된 순열 집합으로 계산 부담을 줄인다.
  • pi-SGD는 무작위 입력 순열을 샘플링하여 Janossy 기반 모델을 학습하기 위한 원칙적인 확률적 최적화 방법을 제공한다.
  • 이 접근법은 실험에서 최첨단 baselines보다 성능을 향상시킨다고 보고된다.
  • Janossy pooling과 finite de Finetti 교환가능성 사이에 확률적 연결 고리가 확립된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.