Skip to main content
QUICK REVIEW

[논문 리뷰] Cutting out the Middle-Man: Training and Evaluating Energy-Based Models without Sampling

Will Grathwohl, Kuan-Chieh Wang|arXiv (Cornell University)|2020. 02. 13.
Generative Adversarial Networks and Image Synthesis인용 수 9
한 줄 요약

이 논문은 샘플링을 필요로 하지 않는 방법을 제안하며, 모델의 로그 밀도의 기울기만을 사용하여 비정규화된 밀도 모델을 훈련하고 평가한다. 신경망을 활용해 데이터 분포와 모델 분포 간의 스틸 산란도를 추정함으로써, 이 접근법은 기존 방법들보다 고차원 데이터에서 더 효율적이고 스케일이 잘 되어 있는 훈련과 우수한 적합도 검증을 가능하게 한다.

ABSTRACT

We present a new method for evaluating and training unnormalized density models. Our approach only requires access to the gradient of the unnormalized model's log-density. We estimate the Stein discrepancy between the data density $p(x)$ and the model density $q(x)$ defined by a vector function of the data. We parameterize this function with a neural network and fit its parameters to maximize the discrepancy. This yields a novel goodness-of-fit test which outperforms existing methods on high dimensional data. Furthermore, optimizing $q(x)$ to minimize this discrepancy produces a novel method for training unnormalized models which scales more gracefully than existing methods. The ability to both learn and compare models is a unique feature of the proposed method.

연구 동기 및 목표

  • 샘플링에 의존하지 않고 비정규화된 밀도 모델을 훈련하고 평가할 수 있는 방법을 개발하는 것.
  • 기존 방법이 어려움을 겪는 고차원 환경에서의 적합도 검증을 향상시키는 것.
  • 비용이 많이 드는 샘플링 단계를 피하여 비정규화된 모델의 스케일이 잘 되어 있고 효율적인 최적화를 가능하게 하는 것.
  • 기울기 기반 산란도 추정을 통해 모델 훈련과 평가를 하나의 프레임워크로 통합하는 것.

제안 방법

  • 모델 밀도 $ q(x) $와 데이터 밀도 $ p(x) $ 사이의 스틸 산란도를 신경망으로 파arameter화된 벡터값 함수를 사용해 추정한다.
  • 샘플링 없이 비정규화된 모델의 로그 밀도의 기울기만을 사용하여 산란도를 계산한다.
  • 신경망 파aram터는 산란도를 최대화하도록 최적화되어 모델 평가를 위한 검정 통계량을 제공한다.
  • 훈련 중에 동일한 산란도를 최소화함으로써 $ q(x) $ 학습을 위한 새로운 최적화 목표가 도출된다.
  • 밀도 정규화 없이도 기울기 기반 최적화가 가능한 점수 함수 기반 공식을 사용해 산란도를 정의한다.
  • 기존의 샘플링 기반 대안들보다 특히 고차원에서 더 우수하게 스케일링된다.

실험 결과

연구 질문

  • RQ1비정규화된 밀도 모델을 모델 분포에서 샘플링 없이 훈련하고 평가할 수 있는가?
  • RQ2기울기 기반 스틸 산란도 추정이 고차원 데이터에서 기존의 적합도 검정보다 우수한 성능을 보일 수 있는가?
  • RQ3제안된 산란도를 최소화하는 것이 기존 방법에 비해 더 나은 모델 학습을 이끌 수 있는가?
  • RQ4기울기 정보만을 사용하여 동일한 프레임워크로 모델 훈련과 평가를 통합할 수 있는가?

주요 결과

  • 제안된 방법은 기존의 샘플링 기반 방법들에 비해 고차원 데이터에서 적합도 검증 성능이 뛰어나다.
  • 산란도 최소화를 통한 모델 훈련은 기존의 샘플링 기반 접근보다 더 우수하게 스케일링된다.
  • 샘플링이 비현실적인 모델에 적용 가능한, 로그 밀도의 기울기만 필요로 한다.
  • 산란도 함수의 신경망 기반 추정은 효과적이고 스케일이 잘 되어 있는 모델 평가를 가능하게 한다.
  • 통합된 프레임워크는 동일한 기울기 기반 산란도 측정을 사용해 동시에 훈련과 평가를 수행할 수 있게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.