QUICK REVIEW

[논문 리뷰] On Self Modulation for Generative Adversarial Networks

Ting Chen, Mario Lučić|arXiv (Cornell University)|2018. 10. 02.

Model Reduction and Neural Networks참고 문헌 40인용 수 44

한 줄 요약

Self-modulation은 입력 노이즈 벡터를 사용해 생성기 특징 맵을 모듈레이션하며, 외부 라벨 없이도 데이터셋, 아키텍처, 손실, 하이퍼파라미터 전반에 걸쳐 GAN 성능을 향상시킵니다. 상대 FID를 5%에서 35%까지 감소시키고 124/144 설정에서 개선을 보입니다.

ABSTRACT

Training Generative Adversarial Networks (GANs) is notoriously challenging. We propose and study an architectural modification, self-modulation, which improves GAN performance across different data sets, architectures, losses, regularizers, and hyperparameter settings. Intuitively, self-modulation allows the intermediate feature maps of a generator to change as a function of the input noise vector. While reminiscent of other conditioning techniques, it requires no labeled data. In a large-scale empirical study we observe a relative decrease of $5\%-35\%$ in FID. Furthermore, all else being equal, adding this modification to the generator leads to improved performance in $124/144$ ($86\%$) of the studied settings. Self-modulation is a simple architectural change that requires no additional parameter tuning, which suggests that it can be applied readily to any GAN.

연구 동기 및 목표

외부 조건 정보에 의존하지 않고 GAN 교육을 안정시키고 샘플 품질을 향상시킨다.
데이터셋, 아키텍처, 손실 함수, 하이퍼파라미터 전반에 걸친 간단한 구조적 수정의 일반적 적용 가능성을 입증한다.
무조건 생성과 조건부 생성 시나리오를 비교하고 이용 가능한 라벨과의 상호 작용을 분석한다.
모듈레이션이 생성기 컨디셔닝과 학습 역학에 어떤 영향을 미치는지 이해하기 위한 진단 정보를 제공한다.

제안 방법

작은 MLP를 통해 BN의 스케일과 시프트 파라미터가 생성기 입력 z에 의존하도록 만들어 Self-modulation을 도입한다.
조건부 생성을 위해 모듈레이션을 적용하기 전에 간단한 이중선형 상호작용을 사용해 z를 라벨 정보와 결합한다.
비포화(non-saturating)와 히지(hinge) 두 손실, 그래디언트 페널티와 스펙트럴 노말라이제이션 두 가지 정규화/정규화 방식, DCGAN 유사 아키텍처와 잔차(Residual) 아키텍처, 그리고 여러 하이퍼파라미터를 대상으로 평가한다.
CIFAR-10, CelebA-HQ, LSUN-bedroom, ImageNet에서 100k 스텝으로 훈련하고(더 긴 훈련은 ImageNet에서 500k 스텝) FID 및 IS를 사용해 평가한다.
기준 BN과의 비교를 무쌍(레이블 없는) 및 페어링된(레이블 있는) 설정 모두에서 수행하고, 하이퍼파라미터 전체에서 최고 성능 모델을 보고한다.

실험 결과

연구 질문

RQ1Self-modulation이 다양한 데이터셋, 아키텍처 및 손실/정규화 설정에서 GAN 성능을 향상시키는가?
RQ2무조건적 및 조건부 GAN에서 이점이 있는가, 그리고 가용한 라벨 정보와의 상호 작용은 어떠한가?
RQ3생성기에서 모듈레이션이 가장 유리한 위치는 어디이며 모든 층에서 모듈레이션이 필요한가?
RQ4Self-modulation이 생성기 Jacobian 조건수와 정밀도/재현율과 같은 진단 지표에 어떤 영향을 미치는가?

주요 결과

Self-modulation을 적용한 설정에서 4%에서 33%에 이르는 FID 개선.
무쌍 설정에서 32개 구성을 대상으로 30개 구성에서 기준 BN보다 우수.
페어링된(조건부) 설정에서 FID의 현저한 향상과 IS의 눈에 띄는 향상을 여러 데이터셋에 걸쳐 달성.
ResNet 아키텍처에 적용 시 모듈레이션은 손실, 정규화, 또는 노말라이제이션에 관계없이 일관되게 성능을 향상시킨다.
더 긴 학습(500k 스텝)을 사용할 때도 개선이 계속되며(무조건 11% FID 감소, 조건부 13%).
Self-modulation은 일반적으로 더 나중 계층에 적용할 때 가장 큰 이점을 제공하고, 모든 계층에 적용하면 최상의 결과를 낸다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.