[論文レビュー] Reinforced Evolutionary Neural Architecture Search
本稿では、強化学習と進化的アルゴリズムを統合することで、アーキテクチャの進化をガイドする強化された突然変異コントローラーを導入した、効率的なNASフレームワークである強化進化的ニューラルアーキテクチャ探索(RENAS)を提案する。この手法により、高速でパラメータ効率の良い探索が可能となり、RENASNet—モバイル最適化アーキテクチャ—が得られ、COCO事前学習なしでImageNetでは75.7%のトップ1正答率、PASCAL VOCのセマンティックセグメンテーションでは75.83%のmIOUを達成した。
Neural Architecture Search (NAS) is an important yet challenging task in network design due to its high computational consumption. To address this issue, we propose the Reinforced Evolutionary Neural Architecture Search (RE- NAS), which is an evolutionary method with the reinforced mutation for NAS. Our method integrates reinforced mutation into an evolution algorithm for neural architecture exploration, in which a mutation controller is introduced to learn the effects of slight modifications and make mutation actions. The reinforced mutation controller guides the model population to evolve efficiently. Furthermore, as child models can inherit parameters from their parents during evolution, our method requires very limited computational resources. In experiments, we conduct the proposed search method on CIFAR-10 and obtain a powerful network architecture, RENASNet. This architecture achieves a competitive result on CIFAR-10. The explored network architecture is transferable to ImageNet and achieves a new state-of-the-art accuracy, i.e., 75.7% top-1 accuracy with 5.36M parameters on mobile ImageNet. We further test its performance on semantic segmentation with DeepLabv3 on the PASCAL VOC. RENASNet outperforms MobileNet-v1, MobileNet-v2 and NASNet. It achieves 75.83% mIOU without being pre-trained on COCO.
研究の動機と目的
- 既存のニューラルアーキテクチャ探索(NAS)手法、特に強化学習(RL)ベースおよび進化的アルゴリズム(EA)ベースの手法における高い計算コストと非効率性を解消すること。
- ランダムな突然変異を学習済みのポリシーに基づく突然変異コントローラーに置き換えることで、進化的NASの効率を向上させること。
- 進化の過程で親モデルから子モデルへのパラメータ伝達を可能にし、トレーニングコストを低減し、収束を加速すること。
- 画像分類やセマンティックセグメンテーションを含む、さまざまなビジョンタスクにうまく一般化する、高性能でモバイルフレンドリーなアーキテクチャ(RENASNet)を発見すること。
- 同じ探索空間内で、独立したRLおよびEAベースの手法と比較して、ハイブリッドRL-EAフレームワークが探索効率および最終的な性能で優れていることを示すこと。
提案手法
- 強化学習ベースの突然変異コントローラーを進化的アルゴリズムに統合し、ランダムな突然変異の代わりに学習済みの適応的行動でアーキテクチャ探索をガイドする。
- 現在の集団のパフォーマンスに基づいて、アーキテクチャの操作を符号化し、突然変異行動を予測するための双方向RNNコントローラーを用いる。
- 進化の過程で親モデルから子モデルへのパラメータ継承を可能にし、トレーニング時間と計算コストを顕著に削減する。
- 高いパフォーマンスを示すアーキテクチャを優遇しつつ、集団の多様性を維持するためのトーナメント選択を適用する。
- バリデーション正答率を報酬信号として用い、方策勾配法により突然変異コントローラーをトレーニングすることで、効果的な修正戦略を学習可能にする。
- 6つの操作選択肢を備えた統一されたセルベース探索空間を探索し、他のNAS手法との比較を容易にする。
実験結果
リサーチクエスチョン
- RQ1強化学習ベースのコントローラーは、突然変異行動をガイドすることで、進化的ニューラルアーキテクチャ探索の効率を向上させることができるか?
- RQ2本稿で提案するRENASフレームワークは、純粋なRLベースおよびEAベースのNAS手法と比較して、探索効率および最終的パフォーマンスにおいてどのように差をつけるか?
- RQ3発見されたアーキテクチャ(RENASNet)は、画像分類やセマンティックセグメンテーションなどのさまざまなビジョンタスクにどの程度一般化できるか?
- RQ4親モデルから子モデルへのパラメータ継承は、NASにおける計算コストを顕著に低減させるか?
- RQ5突然変異コントローラーに双方向RNNを使用した場合、単方向RNNと比較して探索パフォーマンスにどのような影響を与えるか?
主な発見
- 同じ探索空間内で、RENASはRLベースおよびEAベースのNAS手法に比べ1.5–2.0倍の高速化を達成し、優れた探索効率を示した。
- RENASNetはCIFAR-10で2.88% ± 0.02の誤差率を達成し、画像分類タスクで優れた性能を示した。
- モバイル用ImageNetでは、RENASNetはたった5.36Mパラメータで75.7%のトップ1正答率を達成し、モバイルモデルにおける新記録を樹立した。
- PASCAL VOC 2012のセマンティックセグメンテーションタスクでは、COCO事前学習なしで75.83%のmIOUを達成し、MobileNet-v1、MobileNet-v2、NASNet-Aを上回った。
- アブレーションスタディにより、双方向RNNコントローラー(単方向RNNと比較)が顕著に優れたパフォーマンスを示し、設計選択の妥当性が裏付けられた。
- COCO事前学習なしでも、ImageNetでトレーニングされたRENASNetは、COCOで事前学習されたMobileNet-v2およびMobileNet-v1を上回り、強力なインダクティブバイアスと一般化能力を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。