[論文レビュー] NAS-Bench-101: Towards Reproducible Neural Architecture Search
NAS-Bench-101 は CIFAR-10 のトレーニングおよび評価指標に対応する 423k のユニークな CNN アーキテクチャを公開・包括的にマッピングするデータセットを提供し、モデルを再訓練することなく迅速で再現可能な NAS ベンチマーキングを可能にします。
Recent advances in neural architecture search (NAS) demand tremendous computational resources, which makes it difficult to reproduce experiments and imposes a barrier-to-entry to researchers without access to large-scale computation. We aim to ameliorate these problems by introducing NAS-Bench-101, the first public architecture dataset for NAS research. To build NAS-Bench-101, we carefully constructed a compact, yet expressive, search space, exploiting graph isomorphisms to identify 423k unique convolutional architectures. We trained and evaluated all of these architectures multiple times on CIFAR-10 and compiled the results into a large dataset of over 5 million trained models. This allows researchers to evaluate the quality of a diverse range of models in milliseconds by querying the pre-computed dataset. We demonstrate its utility by analyzing the dataset as a whole and by benchmarking a range of architecture optimization algorithms.
研究の動機と目的
- 公開され、再現性のある研究を可能にする NAS データセットを提供する。
- コンパクトで表現力のある探索空間を定義し、アーキテクチャを網羅的に評価する。
- 公平な比較を確保する標準化された訓練/評価パイプラインを提供する。
- 探索空間の特性とアルゴリズムベンチマークの分析を通じてデータセットの有用性を示す。
提案手法
- 7ノードのセルグラフ空間を定義し、3つの操作ラベル(3x3 conv, 1x1 conv, 3x3 max-pool)を用い、V ≤ 7 および最大9エッジに制約する。
- グラフ同型性削減と固定セルエンコーディングを使って約423k個のユニークグラフを列挙する。
- 固定の結合セマンティクスを持つCNNセルへグラフを変換する(出力で結合、他の場所は加算)。
- 単一の公開トレーニングパイプラインと固定ハイパーパラメータ(コサイン LR 減衰、RMSProp、L2 正則化)で CIFAR-10 上で全アーキテクチャを訓練する。
- 各アーキテクチャを4, 12, 36, 108 の4つのエポック予算で3回訓練を繰り返し、分散を測定し多忠実度ベンチマーキングを可能にする。
実験結果
リサーチクエスチョン
- RQ1網羅的に評価された NAS 探索空間は、アーキテクチャ設計の選択肢と探索空間特性を分析するのに使えるか。
- RQ2固定の公開データセットでベンチマークした場合、異なる NAS 最適化アルゴリズムはどのように性能を示すか。
- RQ3NAS-Bench-101内のアーキテクチャ操作とセルの深さ/幅が精度と訓練コストに与える影響はどの程度か。
- RQ4探索空間の局所性特性は NAS アルゴリズムの性能にどの程度影響するか。
主な発見
- データセットは 423k のユニークなアーキテクチャを訓練/検証/テスト指標へマッピングしており、再訓練なしで迅速な検索が可能。
- 最良のアーキテクチャは CIFAR-10 の平均テスト精度 94.32% を達成;ResNet様セルとInception様セルはそれぞれ 93.12%、92.95% に達する。
- ほとんどのアーキテクチャは高い訓練精度を達成し、検証/テストの不整合が小さい(108 エポックで検証精度とテスト精度の相関は r=0.999)。
- 手で設計されたセルは精度と訓練コストのパレート前線付近にあり、トポロジーと操作の選択が高性能と効率性のために重要であることを示す。
- 探索空間の局所性は強く、有意な性能変化は小さな編集距離内に集中する;空間の約35.4%がトップグラフから距離6以内に位置する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。