[論文レビュー] Pareto Set Learning for Expensive Multi-Objective Optimization
PSL は trade-off preferences から全Pareto集合へのパラメトリックマッピングを学習し、効率的なバッチ MOBO と限られた評価下での柔軟な意思決定を可能にする。
Expensive multi-objective optimization problems can be found in many real-world applications, where their objective function evaluations involve expensive computations or physical experiments. It is desirable to obtain an approximate Pareto front with a limited evaluation budget. Multi-objective Bayesian optimization (MOBO) has been widely used for finding a finite set of Pareto optimal solutions. However, it is well-known that the whole Pareto set is on a continuous manifold and can contain infinite solutions. The structural properties of the Pareto set are not well exploited in existing MOBO methods, and the finite-set approximation may not contain the most preferred solution(s) for decision-makers. This paper develops a novel learning-based method to approximate the whole Pareto set for MOBO, which generalizes the decomposition-based multi-objective optimization algorithm (MOEA/D) from finite populations to models. We design a simple and powerful acquisition search method based on the learned Pareto set, which naturally supports batch evaluation. In addition, with our proposed model, decision-makers can readily explore any trade-off area in the approximate Pareto set for flexible decision-making. This work represents the first attempt to model the Pareto set for expensive multi-objective optimization. Experimental results on different synthetic and real-world problems demonstrate the effectiveness of our proposed method.
研究の動機と目的
- 評価コストが高い高価な多目的最適化問題を動機づける。
- 有限の部分集合ではなく、全体のParetoセットを近似する方法を提案する。
- 嗜好をPareto解へマッピングすることで柔軟な意思決定を可能にする。
- 軽量でバッチ対応の獲得手順を提供する。
- 合成ベンチマークと実世界のエンジニアリング問題で有効性をデモンストレーションする。
提案手法
- 補助的Tchebycheffスカラー化を用いてトレードオフ嗜好をPareto解へマッピングするセットモデルを導入する。
- MLP(多層パーセプトロン)をPareto集合モデルとして用い、嗜好の単体上の任意のλに対してx(λ)を出力するようにする。
- 各目的関数に対するガウス過程代理を用いてモデルを訓練し、θパラメータを勾配法で最適化する。
- サンプルされた嗜好に対して拡張Tchebycheffスカラー化の期待値を最小化することでθを最適化する(モンテカルロ法)。
- MOBOにおける探索と活用をバランスさせるため、f の下信頼界限を代理モデルとして採用する。
- 学習済み Pareto集合から候補解を生成し、ハイパーボリューム改善を最大化してバッチを選択する、嗜好をサンプリングするバッチ選択手順を開発する。
実験結果
リサーチクエスチョン
- RQ1高価なMOBOにおいて、Pareto集合を嗜好から Pareto最適解への連続的な写像として学習できるか?
- RQ2PSL は有限集団MOBO法と比較して、効率的なバッチ候補選択と Pareto集合の探索性の向上を実現するか?
- RQ3学習された Pareto集合は、合成問題と実世界の問題で真の Pareto集合/フロントをどれだけよく近似するか?
- RQ4既存のMOBOアプローチと比較した場合の PSL の計算オーバーヘッドはどれくらいか?
- RQ5 PSL は利用者が Pareto集合全体を横断してトレードオフをナビゲーションできる柔軟な意思決定をサポートするか?
主な発見
| 問題 | #目的数 | MOEA/D-EGO | TSEMO | USeMO-EI | DGEMO | qEHVI | PSL: モデル + 選択 |
|---|---|---|---|---|---|---|---|
| F1 | 2 | 40.95 | 4.82 | 6.12 | 61.48 | 36.71 | 6.59 |
| DTLZ2 | 3 | 71.83 | 7.28 | 8.76 | 83.57 | 75.92 | 8.61 |
- PSL は全 Pareto集合とそのフロントを近似でき、嗜好制御を通じてトレードオフの探索を可能にする。
- PSL ベースのMOBOは、合成ベンチマークと実世界の問題において、いくつかの MOBO ベースラインと比較してハイパーボリュームの進行で競争力があるか、または上回る。
- 学習された Pareto集合は可視化可能で意思決定者が好みのトレードオフを選択するのに利用できる。
- PSL は他の MOBO 手法と比較して反復毎の実行時間が低いまたは同等で、バッチ選択による追加の利得がある。
- バッチ PSL アプローチは、パフォーマンス向上を維持しつつ効率的なバッチ評価をサポートする。
- 実験は、PSL が合成タスクで真のフロントに非常に近い Pareto fronts を学習し、実世界設計では近似フロントを示すことを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。