QUICK REVIEW

[論文レビュー] Efficient Hyperparameter Optimization and Infinitely Many Armed Bandits

Afshin Rostamizadeh, Ameet Talwalkar|arXiv (Cornell University)|Jan 1, 2017

Machine Learning and Data Classification参考文献 44被引用数 138

ひとこと要約

この論文では、ハイパラメータ最適化の問題を、リソースが性能に基づいて構成に適応的に割り当てられる非確率的無限に多くのスロットマシン問題として定式化する、Hyperbandという新しいハイパラメータ最適化手法を提案する。性能に応じて有望な構成にリソースを効率的に割り当てることで、ベイズ最適化やランダムサーチに比べて顕著な高速化を達成し、有利な設定では2倍の時間で学習された手法を上回る性能を発揮する。

ABSTRACT

Performance of machine learning algorithms depends critically on identifying a good set of hyperparameters. While current methods offer efficiencies by adaptively choosing new configurations to train, an alternative strategy is to adaptively allocate resources across the selected configurations. We formulate hyperparameter optimization as a pure-exploration non-stochastic infinitely many armed bandit problem where allocation of additional resources to an arm corresponds to training a configuration on larger subsets of the data. We introduce Hyperband for this framework and analyze its theoretical properties, providing several desirable guarantees. We compare Hyperband with state-of-the-art Bayesian optimization methods and a random search baseline on a comprehensive benchmark including 117 datasets. Our results on this benchmark demonstrate that while Bayesian optimization methods do not outperform random search trained for twice as long, Hyperband in favorable settings offers valuable speedups.

研究の動機と目的

機械学習におけるハイパラメータ最適化の効率性を高める挑戦に応えること。ハイパラメータの選択が性能に大きく影響することを踏まえる。
ハイパラメータチューニングを、純粋な探索、非確率的、無限に多くのスロットマシン問題としてモデル化すること。ここで、スロットマシンの「腕」はハイパラメータ構成に対応し、リソース割り当てはより大きなデータサブセットでの学習に対応する。
有望な構成に計算リソースを適応的に割り当てることで、ランダムまたは固定リソースの探索戦略よりも効率を向上させる手法を設計すること。
バンドイットフレームワーク下での提案手法の性能に対して理論的保証を提供すること。
117個のデータセットからなる大規模ベンチマーク上で、最先端のベイズ最適化とランダムサーチとを比較して、Hyperbandの実験的評価を行うこと。

提案手法

手法は、ハイパラメータ最適化を非確率的無限に多くのスロットマシン問題としてモデル化し、各腕が一意のハイパラメータ構成に対応する。
リソース割り当ては、訓練データの増加するサブセットで各構成を訓練することとして定式化され、各割り当て段階の後に性能が測定される。
Hyperbandは、中間の訓練段階での性能に基づいて、初期に有望さを示した構成により多くのリソースを動的に割り当てる。
アルゴリズムは、性能が悪い構成を早期に除外する逐次半減戦略を用い、計算リソースを最も有望な構成に集中させる。
理論的分析により、評価される構成の期待数や、近似的に最適な構成を特定する確率についての保証が得られる。
この手法は、下位の機械学習アルゴリズムに依存しないため、さまざまなモデルやデータセットに広く適用可能である。

実験結果

リサーチクエスチョン

RQ1ハイパラメータ構成間での適応的リソース割り当ては、固定リソースまたはランダム探索戦略を上回る性能を発揮するか？
RQ2提案されたHyperband手法は、ハイパラメータチューニングにおいて、最先端のベイズ最適化を上回るサンプル効率を達成するか？
RQ3後者に2倍の学習時間を割り当てた場合、ランダムサーチと比較してHyperbandはどのように振る舞うか？
RQ4ハイパラメータ最適化の非確率的無限に多くのスロットマシン定式化に対して、どのような理論的保証を提供できるか？
RQ5どのような設定でHyperbandは、既存の手法に対して有意義な高速化を提供するか？

主な発見

ベイズ最適化手法が2倍の時間で学習されたランダムサーチを上回らない設定において、Hyperbandは顕著に優れた性能を発揮する。
117個のデータセットからなるベンチマークにおいて、Hyperbandはベイズ最適化よりもはるかに低い計算コストで優れた性能を達成する。
特に、性能が悪い構成の早期停止が効果を発揮するような有利な設定では、有意義な高速化を示す。
ベイズ最適化手法は、後者に2倍の時間を割り当てた場合でも、ランダムサーチを上回らないことが判明し、この文脈では現在のベイズアプローチの非効率性が浮き彫りになる。
Hyperbandの理論的枠組みは、高い確率で近似的に最適な構成を特定する強力な保証を提供する。
実験的結果は、適応的リソース割り当てが、一様またはランダムな割り当て戦略よりも効率的なハイパラメータ探索をもたらすことを確認する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。