[論文レビュー] AGAN: Towards Automated Design of Generative Adversarial Networks
AGANはGANに特化した初のニューラルアーキテクチャ探索法を提示し、強化学習を用いて生成器と識別器のアーキテクチャを自動設計。CIFAR-10で人間が作成したモデルと競合あるいはそれを凌ぐ性能を達成し、STL-10への転移性を示す。
Recent progress in Generative Adversarial Networks (GANs) has shown promising signs of improving GAN training via architectural change. Despite some early success, at present the design of GAN architectures requires human expertise, laborious trial-and-error testings, and often draws inspiration from its image classification counterpart. In the current paper, we present the first neural architecture search algorithm, automated neural architecture search for deep generative models, or AGAN for abbreviation, that is specifically suited for GAN training. For unsupervised image generation tasks on CIFAR-10, our algorithm finds architecture that outperforms state-of-the-art models under same regularization techniques. For supervised tasks, the automatically searched architectures also achieve highly competitive performance, outperforming best human-invented architectures at resolution $32 imes32$. Moreover, we empirically demonstrate that the modules learned by AGAN are transferable to other image generation tasks such as STL-10.
研究の動機と目的
- GANアーキテクチャ設計の自動化を動機づけ、専門知識と試行錯誤への依存を減らす。
- GAN(生成器と識別器)専用のRLベースNASフレームワークを開発する。
- GAN用のアップサンプリング、ダウンサンプリング、ノーマルモジュールを含むモジュラー探索空間を探る。
- 同じ正則化の下で、発見されたAGANアーキテクチャが人間設計のGANと互角またはそれを上回ることを示す。
- 学習したモジュールの STL-10 のような他のデータセットへの転移性を調査する。
提案手法
- コントローラRNN(3セグメント付き2層のLSTM)を用いて生成器と識別器のGANアーキテクチャをサンプリングする。
- 様々な操作(畳み込み、分離畳み込み、プーリング、アップ-/ダウンサンプリング方式)を含むアップサンプリング、ダウンサンプリング、ノーマルモジュールを含む網羅的探索空間を定義する。
- ヒンジ損失GAN目標を用いてアーキテクチャを訓練し、報酬信号としてInception Score(IS)で評価する。
- 正規化されたISで形作られた報酬を用いてコントローラパラメータをREINFORCEで更新し、探索を有望なアーキテクチャへ導く。
- メタアーキテクチャの詳細を固定する(生成器は3つのアップサンプリングモジュール、識別器は畳み込み層、2つのダウンサンプリングモジュール、2つのノーマルモジュール、グローバル総和プーリング、および線形層)。
- 学習したモジュールを STL-10 で転用可能と示し、入力サイズを適切に調整する。
実験結果
リサーチクエスチョン
- RQ1強化学習ベースのNASが同じ正則化下で人間設計モデルに劣らない、あるいは凌ぐGANアーキテクチャを発見できるか?
- RQ2自動最適化されたとき、どのモジュール GAN アーキテクチャ(アップサンプリング、ダウンサンプリング、ノーマルモジュール)が効果的に現れるか?
- RQ3学習したアーキテクチャモジュールは関連する画像生成タスク(例:CIFAR-10からSTL-10)に転移可能か?
- RQ4Inception Scoreによる報酬設計はNASの効率と探索結果にどのような影響を与えるか?
- RQ5NASで発見されたGANセルと従来のGANアーキテクチャとの定性的な違いは何か?
主な発見
- AGANは3つの新規モジュラーアーキテクチャ(AGAN-A、AGAN-B、AGAN-C)を特定し、最先端のGANと競合する性能を示した。
- CIFAR-10の教師なし生成で、AGAN-Cは同じ正則化の下で最先端モデルを上回る。
- 教師付きCIFAR-10生成では、AGAN-A、AGAN-B、AGAN-CはInception ScoreおよびFID指標が人間設計アーキテクチャと競合するかそれを凌ぐ水準に達し、AGAN-BはIS 8.82±0.09、FID 23.8を達成。
- 学習したモジュールはSTL-10への転移性を示し、適切な入力サイズ変更で高い性能を維持(例:AGAN-A 9.23 IS、52.7 FID;AGAN-C 8.97 IS、57.4 FID;AGAN-B 7.84 IS、71.8 FID)。
- コントローラの動作分布はモジュールタイプ(アップサンプリング、ダウンサンプリング、ノーマル)ごとに異なり、GAN設計にはモジュール化探索が必要であることを支持する。
- 発見されたセルはInception-ResNetハイブリッドに類似しており、GAN最適化アーキテクチャが識別タスクのアーキテクチャと大きく異なる可能性を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。