Skip to main content
QUICK REVIEW

[論文レビュー] Pareto Set Learning for Expensive Multi-Objective Optimization

Xi Lin, Zhiyuan Yang|arXiv (Cornell University)|Oct 16, 2022
Advanced Multi-Objective Optimization Algorithms被引用数 23
ひとこと要約

PSL は trade-off preferences から全Pareto集合へのパラメトリックマッピングを学習し、効率的なバッチ MOBO と限られた評価下での柔軟な意思決定を可能にする。

ABSTRACT

Expensive multi-objective optimization problems can be found in many real-world applications, where their objective function evaluations involve expensive computations or physical experiments. It is desirable to obtain an approximate Pareto front with a limited evaluation budget. Multi-objective Bayesian optimization (MOBO) has been widely used for finding a finite set of Pareto optimal solutions. However, it is well-known that the whole Pareto set is on a continuous manifold and can contain infinite solutions. The structural properties of the Pareto set are not well exploited in existing MOBO methods, and the finite-set approximation may not contain the most preferred solution(s) for decision-makers. This paper develops a novel learning-based method to approximate the whole Pareto set for MOBO, which generalizes the decomposition-based multi-objective optimization algorithm (MOEA/D) from finite populations to models. We design a simple and powerful acquisition search method based on the learned Pareto set, which naturally supports batch evaluation. In addition, with our proposed model, decision-makers can readily explore any trade-off area in the approximate Pareto set for flexible decision-making. This work represents the first attempt to model the Pareto set for expensive multi-objective optimization. Experimental results on different synthetic and real-world problems demonstrate the effectiveness of our proposed method.

研究の動機と目的

  • 評価コストが高い高価な多目的最適化問題を動機づける。
  • 有限の部分集合ではなく、全体のParetoセットを近似する方法を提案する。
  • 嗜好をPareto解へマッピングすることで柔軟な意思決定を可能にする。
  • 軽量でバッチ対応の獲得手順を提供する。
  • 合成ベンチマークと実世界のエンジニアリング問題で有効性をデモンストレーションする。

提案手法

  • 補助的Tchebycheffスカラー化を用いてトレードオフ嗜好をPareto解へマッピングするセットモデルを導入する。
  • MLP(多層パーセプトロン)をPareto集合モデルとして用い、嗜好の単体上の任意のλに対してx(λ)を出力するようにする。
  • 各目的関数に対するガウス過程代理を用いてモデルを訓練し、θパラメータを勾配法で最適化する。
  • サンプルされた嗜好に対して拡張Tchebycheffスカラー化の期待値を最小化することでθを最適化する(モンテカルロ法)。
  • MOBOにおける探索と活用をバランスさせるため、f の下信頼界限を代理モデルとして採用する。
  • 学習済み Pareto集合から候補解を生成し、ハイパーボリューム改善を最大化してバッチを選択する、嗜好をサンプリングするバッチ選択手順を開発する。

実験結果

リサーチクエスチョン

  • RQ1高価なMOBOにおいて、Pareto集合を嗜好から Pareto最適解への連続的な写像として学習できるか?
  • RQ2PSL は有限集団MOBO法と比較して、効率的なバッチ候補選択と Pareto集合の探索性の向上を実現するか?
  • RQ3学習された Pareto集合は、合成問題と実世界の問題で真の Pareto集合/フロントをどれだけよく近似するか?
  • RQ4既存のMOBOアプローチと比較した場合の PSL の計算オーバーヘッドはどれくらいか?
  • RQ5 PSL は利用者が Pareto集合全体を横断してトレードオフをナビゲーションできる柔軟な意思決定をサポートするか?

主な発見

問題#目的数MOEA/D-EGOTSEMOUSeMO-EIDGEMOqEHVIPSL: モデル + 選択
F1240.954.826.1261.4836.716.59
DTLZ2371.837.288.7683.5775.928.61
  • PSL は全 Pareto集合とそのフロントを近似でき、嗜好制御を通じてトレードオフの探索を可能にする。
  • PSL ベースのMOBOは、合成ベンチマークと実世界の問題において、いくつかの MOBO ベースラインと比較してハイパーボリュームの進行で競争力があるか、または上回る。
  • 学習された Pareto集合は可視化可能で意思決定者が好みのトレードオフを選択するのに利用できる。
  • PSL は他の MOBO 手法と比較して反復毎の実行時間が低いまたは同等で、バッチ選択による追加の利得がある。
  • バッチ PSL アプローチは、パフォーマンス向上を維持しつつ効率的なバッチ評価をサポートする。
  • 実験は、PSL が合成タスクで真のフロントに非常に近い Pareto fronts を学習し、実世界設計では近似フロントを示すことを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。