Skip to main content
QUICK REVIEW

[論文レビュー] Federated Neural Architecture Search

Yuan, Jinliang, Mengwei Xu|arXiv (Cornell University)|Feb 15, 2020
Privacy-Preserving Technologies in Data参考文献 38被引用数 23
ひとこと要約

本論文は、分散型でプライバシーを守るフェデレーテッドラーニングにおける自動ニューラルアーキテクチャサーチを可能にする、Federated Neural Architecture Search (Federated NAS) という新しいパラダイムを提案する。DecNAS というフレームワーク(並列候補学習、動的ラウンドスケジューリング、早期候補破棄を特徴とする)を導入することで、中央集権的NASと同等の最先端の精度を達成するとともに、クライアントの通信および計算コストを最大200倍まで削減する。

ABSTRACT

To preserve user privacy while enabling mobile intelligence, techniques have been proposed to train deep neural networks on decentralized data. However, training over decentralized data makes the design of neural architecture quite difficult as it already was. Such difficulty is further amplified when designing and deploying different neural architectures for heterogeneous mobile platforms. In this work, we propose an automatic neural architecture search into the decentralized training, as a new DNN training paradigm called Federated Neural Architecture Search, namely federated NAS. To deal with the primary challenge of limited on-client computational and communication resources, we present FedNAS, a highly optimized framework for efficient federated NAS. FedNAS fully exploits the key opportunity of insufficient model candidate re-training during the architecture search process, and incorporates three key optimizations: parallel candidates training on partial clients, early dropping candidates with inferior performance, and dynamic round numbers. Tested on large-scale datasets and typical CNN architectures, FedNAS achieves comparable model accuracy as state-of-the-art NAS algorithm that trains models with centralized data, and also reduces the client cost by up to two orders of magnitude compared to a straightforward design of federated NAS.

研究の動機と目的

  • 分散型でプライバシーを守るフェデレーテッドラーニング環境において、効率的なニューラルアーキテクチャの設計を解決すること。
  • リソース制限のあるモバイルクライアント上で、ニューラルアーキテクチャサーチ (NAS) の高い計算および通信コストを低減すること。
  • リソース予算が異なる多様なモバイルプラットフォームに適応する自動アーキテクチャサーチを可能にすること。
  • フェデレーテッドトレーニングを通じてデータプライバシーを確保しつつ、中央集権的NASと同等の高いモデル精度を維持すること。
  • アーキテクチャサーチ中にクライントリソース使用を動的に最適化できるスケーラブルで効率的なフレームワークを開発すること。

提案手法

  • DecNAS はアーキテクチャサーチとモデルトレーニングを分離し、クラウドにサーチの調整を、クライアントにローカルトレーニングを割り当てる。これにより、データプライバシーが保たれる。
  • 複数のDNN候補を異なるクライアントグループで同時にトレーニング・テストする並列チューニングを採用する。
  • 各グループが多様なデータ分布とサイズを代表するように、原理的(principled)なクライアントパーティショニングアルゴリズムを適用し、候補評価の一般化性を向上させる。
  • 性能トレンドに基づいて各候補のトレーニングラウンド数を動的に調整することで、不要な計算を削減する。
  • 最小限のトレーニング後に性能が芳しくない候補を早期に破棄することで、非生産的なトレーニングサイクルを排除し、クライアントリソースを節約する。
  • 完全な再トレーニングを減らすために、NASにおける内在的冗長性を活用し、代理タスクアプローチを用いて候補のパフォーマンスを推定する。

実験結果

リサーチクエスチョン

  • RQ1分散型でプライバシーを守るフェデレーテッドラーニング環境において、ニューラルアーキテクチャサーチを効率的に行うことは可能か?
  • RQ2モデル精度を損なわずに、フェデレーテッドNASにおけるクライアント側の計算および通信コストをどのように最小化できるか?
  • RQ3部分的なクライアント参加と動的ラウンドスケジューリングは、リソース制約下でもサーチ精度を維持するために果たす役割は何か?
  • RQ4クライアント間で非IID(非独立同分布)なデータ分布がある場合、フェデレーテッド環境におけるアーキテクチャサーチの信頼性にどのような影響を与えるか?
  • RQ5早期破棄と並列トレーニングを組み合わせることで、エンドツーエンドのサーチコストをどの程度削減でき、パフォーマンスを維持できるか?

主な発見

  • ImageNet において、DecNAS は MobileNet の75%の複雑さでトップ1精度68.8%を達成し、中央集権的NASと同等の性能を発揮するとともに、クライアントのアップリンクコストを最大86%まで削減した。
  • 100のクライアントグループを用いた場合、デフォルトの14グループ設定と比較して、オンクライアント通信コストを86%削減したが、精度は0.3%低下した。
  • 7つのクライアントグループのみを用いた場合、デフォルト設定と比較してアップリンクコストが100%増加したが、精度の向上は最小限(0.1%向上)にとどまり、過剰なパーティショニングの非効率性が確認された。
  • 10ラウンド未満の短期間のファインチューニングでは、モデル収束が不十分なため精度が低下する傾向にあり、動的ラウンドスケジューリングの重要性が浮き彫りになった。
  • アーキテクチャ生成後に長期的なファインチューニングを実施することで、モデル精度が最大20%向上した。これは、選択後の延長トレーニングの価値を示している。
  • ナイーブなフェデレーテッドNAS実装と比較して、DecNAS はクライアントコストを最大200倍まで削減し、モバイルデバイス上での大規模な展開を可能にした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。