QUICK REVIEW

[論文レビュー] An Entropy Search Portfolio for Bayesian Optimization

Bobak Shahriari, Ziyu Wang|arXiv (Cornell University)|Jun 18, 2014

Advanced Bandit Algorithms Research参考文献 36被引用数 41

ひとこと要約

本稿では、ベイズ最適化のパフォーマンスが問題の種類によって大きく異なることや、事前に未知であることを踏まえ、過去のパフォーマンスではなく、グローバル最適解に関する期待情報量の増加に基づいて、獲得関数を選択する情報理論的メタ基準であるエントロピー探索パフォーマンス（ESP）を提案する。ESPは、個々の獲得関数や従来のパフォーマンス手法を上回り、優れた構成戦略を常に超えるとともに、劣った専門家が含まれても安定性を示す。

ABSTRACT

Bayesian optimization is a sample-efficient method for black-box global optimization. How- ever, the performance of a Bayesian optimization method very much depends on its exploration strategy, i.e. the choice of acquisition function, and it is not clear a priori which choice will result in superior performance. While portfolio methods provide an effective, principled way of combining a collection of acquisition functions, they are often based on measures of past performance which can be misleading. To address this issue, we introduce the Entropy Search Portfolio (ESP): a novel approach to portfolio construction which is motivated by information theoretic considerations. We show that ESP outperforms existing portfolio methods on several real and synthetic problems, including geostatistical datasets and simulated control tasks. We not only show that ESP is able to offer performance as good as the best, but unknown, acquisition function, but surprisingly it often gives better performance. Finally, over a wide range of conditions we find that ESP is robust to the inclusion of poor acquisition functions.

研究の動機と目的

ベイズ最適化における獲得関数の最適選択という課題に取り組む。これは、問題の種類によってパフォーマンスが大きく異なるが、事前に未知であるためである。
過去のパフォーマンス指標に依存するパフォーマンス手法の限界を克服する。これは、多様な獲得関数戦略の選択において、誤解を招く可能性があるためである。
劣ったまたは性能が低下する獲得関数に対しても安定性を保ちつつ、多様な最適化問題において高いパフォーマンスを発揮するメタ基準を開発する。
目的関数の代表的最小値を体系的にサンプリングする手法を導入することで、連続領域へのトンプソンサンプリングの拡張を実現する。
実世界および合成問題（地質統計データセットや制御タスクを含む）に対して、提案手法を実験的に評価し、優れた性能と高い安定性を示す。

提案手法

ESPは、情報理論的原則に基づいたパフォーマンスメタ基準を構築し、グローバル最小値の事後分布のエントロピーの期待的減少を最大化する。
本手法は、$ p( extbf{x}_ ext{star}| ext{D}) $ からの候補最小値の近似サンプリングを用い、ラヒミとレーチュ（2007）の手法にインspiredされた技術により、連続空間におけるトンプソンサンプリングを可能にする。
代表点（リプレーサー）を生成するサブルーチンを採用し、潜在的なグローバル最適解を近似することで、各候補獲得関数の情報量の増加を評価できる。
本メタ基準は、過去のパフォーマンスやヒューリスティック指標に依存せず、グローバル最小値の位置に関する期待情報量の増加を最大化する獲得関数を選択する。
各イテレーションで、情報量の増加に基づいて動的に最良の獲得関数を選択するメタ基準を用いて、ベイズ最適化ループに統合する。
本手法は、合成関数、地質統計データセット（Brenda および Agromet）、制御タスク（Walker および Repeller）を含む多様なベンチマークで評価され、既存のパフォーマンス手法および個々の獲得関数と比較されている。

実験結果

リサーチクエスチョン

RQ1情報理論的メタ基準は、過去のパフォーマンスに基づくパフォーマンス手法を凌駕できるか？
RQ2提案されたエントロピー探索パフォーマンス（ESP）は、多様な最適化問題において、未知の最良の獲得関数と同等またはそれ以上のパフォーマンスを達成できるか？
RQ3ESPは、パフォーマンスが劣るまたは劣化する獲得関数が含まれる場合にも、その影響をほとんど受けることなく安定性を保つことができるか？
RQ4代表的最小値の体系的サンプリングを用いることで、連続領域へのトンプソンサンプリングを効果的に拡張できるか？
RQ5ESPは、次元数や構造が異なる問題、特に滑らかでないかぎりぎりの目的関数に対しても、強力なパフォーマンスを維持できるか？

主な発見

ESPは、地質統計データセットBrendaおよびAgrometにおいて、すべてのベースラインパフォーマンス手法（RPおよびGPHedge）を上回り、両方のデータセットで最良のパフォーマンスを達成した。
Brendaデータセットでは、ESPはすべての他の手法、包括して最良の個別獲得関数（トンプソンサンプリング）を顕著に上回った。これは、ESPがその最良の構成戦略をも超える性能を発揮できることを示している。
Repeller制御タスクでは、ESPは最良の手法（RP）と同等の性能を示したが、劣った専門家が含まれてもパフォーマンスの低下が最小限に抑えられ、より高い安定性を示した。
ESP9（劣った獲得関数を含む9つの獲得関数を含む）は、ESPとほぼ同等のパフォーマンスを示し、劣化する専門家が含まれても強い耐性を示していることがわかった。
グローバル最小値の代表点をサンプリングするための提案手法により、連続空間へのトンプソンサンプリングの体系的拡張が可能となり、実験的に検証され、最適化において有効であることが示された。
Walker制御タスクでは、ESPが最良のパフォーマンスを示したが、GPHedgeは劣悪なパフォーマンスを示した。これは、本手法が複雑で高次元の問題に対しても適応可能であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。