Skip to main content
QUICK REVIEW

[논문 리뷰] Relaxed Control and Gamma-Convergence of Stochastic Optimization Problems with Mean Field

Lijun Bo, Agostino Capponi|arXiv (Cornell University)|2019. 06. 20.
Model Reduction and Neural Networks인용 수 2
한 줄 요약

이 논문은 연속층 이deal화에서 표본을 추출함으로써 딥 리텐셔널 네트워크 내 평균장 스토하스틱 최적화 문제에 대한 최적의 이완 제어의 존재성을 확립한다. 표본 추출된 목적 기능의 Γ수렴을 증명하며, 이는 무작위 환경 내 비선형 Fokker-Planck-Kolmogorov 방정식의 해와 연결된 극한과 관련이 있으며, 최적의 네트워크 가중치는 분포의 의미에서 노이만 경계 조건을 갖는 이阶 미분 방정식을 푸는 것으로 계산될 수 있음을 보여준다.

ABSTRACT

We study a class of stochastic optimization problems of the mean-field type arising in the optimal training of a deep residual neural network. We consider the sampling problem arising from a continuous layer idealization, and establish the existence of optimal relaxed controls when the training set has finite size. The core of our paper is to prove the Gamma-convergence of the sequence of sampled objective functionals, i.e., show that as the size of the training set grows large, the minimizer of the sampled relaxed problem converges to that of the limiting optimization problem. We connect the limit of the large sampled objective functional to the unique solution, in the trajectory sense, of a nonlinear Fokker-Planck-Kolmogorov (FPK) equation in a random environment. We construct an example to show that, under mild assumptions, the optimal network weights can be numerically computed by solving a second-order differential equation with Neumann boundary conditions in the sense of distributions.

연구 동기 및 목표

  • 딥 리텐셔널 네트워크 학습에서 발생하는 스토하스틱 최적화 문제에 있어서 최적의 이완 제어의 존재성을 확립하기.
  • 학습 데이터 크기가 증가함에 따라 표본 추출된 목적 기능의 수렴을 분석하기.
  • 표본 추출된 목적 기능의 극한이 무작위 환경 내 비선형 Fokker-Planck-Kolmogorov(FPK) 방정식의 해와 연결되는지 확인하기.
  • 최적의 네트워크 가중치가 분포의 의미에서 노이만 경계 조건을 갖는 이阶 미분 방정식을 풀어 수치적으로 계산될 수 있음을 보여주기.

제안 방법

  • 연속층 이deal화를 통해 딥 리텐셔널 네트워크의 학습을 모델링함으로써 평균장 스토하스틱 최적화 문제로 이어지게 하기.
  • 최적화 경계의 비볼록성과 비연속성 문제를 다루기 위해 이완 제어를 도입하기.
  • 학습 데이터 크기가 무한히 증가함에 따라 표본 추출된 목적 기능의 Γ수렴을 증명하기.
  • 극한 기능과 무작위 환경 내 비선형 Fokker-Planck-Kolmogorov(FPK) 방정식의 유일한 해 사이의 연결 고리를 확립하기.
  • 분포의 의미에서 최적의 네트워크 가중치를 특징짓는 이阶 미분 방정식과 노이만 경계 조건을 구성하기.
  • 분포해를 사용하여 약한 조건 하에서 최적의 가중치를 수치적으로 계산할 수 있도록 하기.

실험 결과

연구 질문

  • RQ1학습 데이터 크기가 증가함에 따라 평균장 스토하스틱 최적화 내 표본 추출 목적 기능이 극한 기능으로 수렴하는가?
  • RQ2표본 추출 목적 기능의 극한이 무작위 환경 내 비선형 Fokker-Planck-Kolmogorov(FPK) 방정식의 해와 관련이 있는가?
  • RQ3최적의 네트워크 가중치는 노이만 경계 조건을 갖는 이阶 미분 방정식을 풀어 계산될 수 있는가?
  • RQ4표본 추출된 이완 문제의 최소화자가 극한 문제의 최소화자로 수렴하는 조건은 무엇인가?
  • RQ5이류의 평균장 최적화 문제에서 최적의 존재성과 수렴성을 보장하기 위해 이완 제어는 어떤 역할을 하는가?

주요 결과

  • 학습 데이터 크기가 커질수록 표본 추출된 목적 기능이 극한 기능으로 Γ수렴한다.
  • 극한 기능은 무작위 환경 내 비선형 Fokker-Planck-Kolmogorov(FPK) 방정식의 유일한 해와 연결된다.
  • 최적의 네트워크 가중치는 분포의 의미에서 노이만 경계 조건을 갖는 이阶 미분 방정식을 풀어 계산될 수 있다.
  • 유한한 학습 데이터 집합에 대해 최적의 이완 제어의 존재성이 입증된다.
  • 약한 조건 하에서 표본 문제의 최소화자가 극한 문제의 최소화자로 수렴함이 보장된다.
  • 이 틀은 분포해를 통한 ODE 해법을 통해 최적의 가중치를 수치적으로 계산할 수 있게 하여, 딥 리텐셔널 네트워크 학습을 위한 실현 가능한 경로를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.