QUICK REVIEW

[論文レビュー] Pareto Set Learning for Expensive Multi-Objective Optimization

Xi Lin, Zhiyuan Yang|arXiv (Cornell University)|Oct 16, 2022

Advanced Multi-Objective Optimization Algorithms被引用数 23

ひとこと要約

PSL は trade-off preferences から全Pareto集合へのパラメトリックマッピングを学習し、効率的なバッチ MOBO と限られた評価下での柔軟な意思決定を可能にする。

ABSTRACT

Expensive multi-objective optimization problems can be found in many real-world applications, where their objective function evaluations involve expensive computations or physical experiments. It is desirable to obtain an approximate Pareto front with a limited evaluation budget. Multi-objective Bayesian optimization (MOBO) has been widely used for finding a finite set of Pareto optimal solutions. However, it is well-known that the whole Pareto set is on a continuous manifold and can contain infinite solutions. The structural properties of the Pareto set are not well exploited in existing MOBO methods, and the finite-set approximation may not contain the most preferred solution(s) for decision-makers. This paper develops a novel learning-based method to approximate the whole Pareto set for MOBO, which generalizes the decomposition-based multi-objective optimization algorithm (MOEA/D) from finite populations to models. We design a simple and powerful acquisition search method based on the learned Pareto set, which naturally supports batch evaluation. In addition, with our proposed model, decision-makers can readily explore any trade-off area in the approximate Pareto set for flexible decision-making. This work represents the first attempt to model the Pareto set for expensive multi-objective optimization. Experimental results on different synthetic and real-world problems demonstrate the effectiveness of our proposed method.

研究の動機と目的

評価コストが高い高価な多目的最適化問題を動機づける。
有限の部分集合ではなく、全体のParetoセットを近似する方法を提案する。
嗜好をPareto解へマッピングすることで柔軟な意思決定を可能にする。
軽量でバッチ対応の獲得手順を提供する。
合成ベンチマークと実世界のエンジニアリング問題で有効性をデモンストレーションする。

提案手法

補助的Tchebycheffスカラー化を用いてトレードオフ嗜好をPareto解へマッピングするセットモデルを導入する。
MLP（多層パーセプトロン）をPareto集合モデルとして用い、嗜好の単体上の任意のλに対してx(λ)を出力するようにする。
各目的関数に対するガウス過程代理を用いてモデルを訓練し、θパラメータを勾配法で最適化する。
サンプルされた嗜好に対して拡張Tchebycheffスカラー化の期待値を最小化することでθを最適化する（モンテカルロ法）。
MOBOにおける探索と活用をバランスさせるため、f の下信頼界限を代理モデルとして採用する。
学習済み Pareto集合から候補解を生成し、ハイパーボリューム改善を最大化してバッチを選択する、嗜好をサンプリングするバッチ選択手順を開発する。

実験結果

リサーチクエスチョン

RQ1高価なMOBOにおいて、Pareto集合を嗜好から Pareto最適解への連続的な写像として学習できるか？
RQ2PSL は有限集団MOBO法と比較して、効率的なバッチ候補選択と Pareto集合の探索性の向上を実現するか？
RQ3学習された Pareto集合は、合成問題と実世界の問題で真の Pareto集合/フロントをどれだけよく近似するか？
RQ4既存のMOBOアプローチと比較した場合の PSL の計算オーバーヘッドはどれくらいか？
RQ5 PSL は利用者が Pareto集合全体を横断してトレードオフをナビゲーションできる柔軟な意思決定をサポートするか？

主な発見

問題	#目的数	MOEA/D-EGO	TSEMO	USeMO-EI	DGEMO	qEHVI	PSL: モデル + 選択
F1	2	40.95	4.82	6.12	61.48	36.71	6.59
DTLZ2	3	71.83	7.28	8.76	83.57	75.92	8.61

PSL は全 Pareto集合とそのフロントを近似でき、嗜好制御を通じてトレードオフの探索を可能にする。
PSL ベースのMOBOは、合成ベンチマークと実世界の問題において、いくつかの MOBO ベースラインと比較してハイパーボリュームの進行で競争力があるか、または上回る。
学習された Pareto集合は可視化可能で意思決定者が好みのトレードオフを選択するのに利用できる。
PSL は他の MOBO 手法と比較して反復毎の実行時間が低いまたは同等で、バッチ選択による追加の利得がある。
バッチ PSL アプローチは、パフォーマンス向上を維持しつつ効率的なバッチ評価をサポートする。
実験は、PSL が合成タスクで真のフロントに非常に近い Pareto fronts を学習し、実世界設計では近似フロントを示すことを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。