QUICK REVIEW

[논문 리뷰] Reducing Noise in GAN Training with Variance Reduced Extragradient

Tatjana Chavdarova, Gauthier Gidel|arXiv (Cornell University)|2019. 04. 18.

Generative Adversarial Networks and Image Synthesis참고 문헌 41인용 수 32

한 줄 요약

이 논문은 GAN 학습의 그래디언트 노이즈를 완화하고 더 나은 수렴을 달성하기 위해 SVRE, 확률적 분산 감소 외추정(Extragradient) 알고리즘을 도입하며, MNIST, CIFAR-10, SVHN, 및 ImageNet 변형에서 강력한 실험적 성과를 보인다.

ABSTRACT

We study the effect of the stochastic gradient noise on the training of generative adversarial networks (GANs) and show that it can prevent the convergence of standard game optimization methods, while the batch version converges. We address this issue with a novel stochastic variance-reduced extragradient (SVRE) optimization algorithm, which for a large class of games improves upon the previous convergence rates proposed in the literature. We observe empirically that SVRE performs similarly to a batch method on MNIST while being computationally cheaper, and that SVRE yields more stable GAN training on standard datasets.

연구 동기 및 목표

게임 최적화에서 GAN 훈련에 미치는 stochastic gradient noise의 영향과 수렴을 강조합니다.
GAN에서 그래디언트 분산을 줄이기 위해 SVRE를 제안하고 형식화합니다.
강한 단조성 및 코시어시비성 가정 하에서 SVRE의 이론적 수렴 보장을 제공합니다.
표준 데이터셋에서 SVRE를 경험적으로 평가하여 안정성, 수렴 속도 및 샘플 품질을 평가합니다.
GAN 설정에서 배치 외추정(bach extragradient) 및 표준 확률적 방법과 SVRE를 비교합니다.]
method_combined_korean_placeholder_1

제안 방법

GAN 학습을 생성기(generator)과 판별기(discriminator) 사이의 두 플레이어 차별 가능한 게임으로 형식화합니다.
SVRE( stochastic variance reduced extragradient )를 SVRG gradient 추정치를 extragradient 프레임워크와 결합하여 도입합니다.
snapshot omega^S와 해당하는 전체 기울기 mu^S를 사용하여 각 플레이어에 대해 편향되지 않은 기울기 추정치 d_i^G 및 d_i^D를 구성합니다.
cocoercivity 유도 상수에 의해 안내되는 비균등 샘플링 pi_i를 도입하고 SVRE를 위한 기하학적/몬테카를로 유사한 epoch 샘플링(q-memorization)을 구현합니다.
적절한 스텝 크기와 함께 Assumption 1(강한 단조성, cocoercivity, 규칙성)에 따른 기대 제곱 오차 감소를 보이는 수렴 정리(Theorem 2)를 제공합니다.
SEG에서의 노이즈 유도 발산과 SVRE의 저항성을 보여주는 동기 부여적 간단한 확률적 이차선형 게임을 제시합니다.

실험 결과

연구 질문

RQ1GAN 훈련을 두 플레이어 게임으로 구성했을 때 stochastic gradient 노이즈가 수렴에 어떤 영향을 미치는가?
RQ2게임 최적화에 분산 감소 기법을 효과적으로 확장해 안정성과 수렴을 향상시킬 수 있는가?
RQ3강한 단조성, cocoercivity, 규칙성 측면에서 SVRE의 이론적 수렴 보장은 무엇인가?
RQ4SVRE 기반 GAN이 배치 외추정 및 일반적인 확률적 방법에 비해 표준 데이터셋에서 성능과 안정성이 경쟁력 있거나 우수한가?

주요 결과

Dataset	SG-A FID	SE-A FID	SVRE FID	WS-SVRE FID
CIFAR-10	21.70	18.65	23.56	16.77
SVHN	5.66	5.14	4.81	4.88

확률적 그래디언트는 GAN 스타일의 게임에서 배치 방법이 수렴하더라도 extragradient 방법에서 발산을 초래할 수 있다.
SVRE는 extragradient 프레임워크 내에서 SVRG 스타일의 그래디언트 추정치를 활용하여 게임의 그래디언트 분산을 줄인다.
이론적 결과: SVRE는 지역적 강한 단조성 및 cocoercivity 하에서 수렴하며, 속도는 mu, ell 및 규칙성 상수에 의존한다(Theorem 2).
경험적으로, MNIST에서 배치 방법과 비슷한 성능을 보이면서 계산적으로 더 저렴하고, CIFAR-10 및 SVHN에서 심층 구조로 더 안정적인 GAN 훈련을 제공한다.
CIFAR-10 및 SVHN에서 심층 구조를 사용할 때, SVRE는 SG-A 및 SE-A 기준선에 비해 더 나은 FID 점수를 달성했다(CIFAR-10: 16.77 for WS-SVRE vs 21.70 SG-A, 18.65 SE-A, 23.56 SVRE; SVHN: 4.88 WS-SVRE vs 5.66 SG-A, 5.14 SE-A, 4.81 SVRE).
WS-SVRE와 함께하는 warm-starting 변형은 기본 불안정성 이후에도 성능 향상을 계속 이어갈 수 있으며 발산하지 않는다.]

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.