QUICK REVIEW

[論文レビュー] Efficient Active Search for Combinatorial Optimization Problems

André Hottung, Yeong‐Dae Kwon|arXiv (Cornell University)|Jun 9, 2021

Metaheuristic Optimization Algorithms Research参考文献 28被引用数 27

ひとこと要約

3つの効率的なアクティブ検索（EAS）戦略を提案し、検索中にモデルパラメータのサブセットのみを更新、TSP、CVRP、JSSPのMLベース構築法の性能を向上させ、最先端のML手法を上回ることが多く、時にはLKH3を上回る。

ABSTRACT

Recently numerous machine learning based methods for combinatorial optimization problems have been proposed that learn to construct solutions in a sequential decision process via reinforcement learning. While these methods can be easily combined with search strategies like sampling and beam search, it is not straightforward to integrate them into a high-level search procedure offering strong search guidance. Bello et al. (2016) propose active search, which adjusts the weights of a (trained) model with respect to a single instance at test time using reinforcement learning. While active search is simple to implement, it is not competitive with state-of-the-art methods because adjusting all model weights for each test instance is very time and memory intensive. Instead of updating all model weights, we propose and evaluate three efficient active search strategies that only update a subset of parameters during the search. The proposed methods offer a simple way to significantly improve the search performance of a given model and outperform state-of-the-art machine learning based methods on combinatorial problems, even surpassing the well-known heuristic solver LKH3 on the capacitated vehicle routing problem. Finally, we show that (efficient) active search enables learned models to effectively solve instances that are much larger than those seen during training.

研究の動機と目的

Bello らのアクティブ検索の高い計算コストを効率的な代替案で動機づけ、解決を試みる。
テスト時の探索中にモデルパラメータのサブセットのみを更新する3つの戦略を開発する。
EASバリアントが複数の組合せ最適化問題で解の品質と一般化を向上させることを実証する。
EASが最先端のMLベース手法を上回り、CVRPとJSSPで強力なヒューリスティック（LKH3）を上回ることがあることを示す。

提案手法

3つのEASバリアントを定義：埋め込み更新（EAS-Emb）、追加層更新（EAS-Lay）、表更新（EAS-Tab）。
各バリアントは探索中にモデルの残りを固定したまま、インスタンス固有の小さなコンポーネントを更新する。
更新を導くためにRLと模倣学習の損失を使用する：L_RLはREINFORCEに基づき、L_ILは incumbentsの最良解の模倣から得られる; L_RIL = L_RL + λ L_ILとして結合。
EAS-Emb: インスタンス埋め込みの一部を勾配で更新する；EAS-Lay: インスタンス固有の残差層を挿入しその重みを訓練する；EAS-Tab: バックプロパゲーションなしにアクション確率に影響を与えるルックアップテーブルを調整する。
TSP（POMOベース）、CVRP（POMOベース）、JSSP（L2Dベース）で評価；Concorde、LKH3、およびいくつかのMLベースのベースラインと比較。

実験結果

リサーチクエスチョン

RQ1効率的なアクティブ検索（パラメータのサブセットのみ更新）が完全なアクティブ検索と同等またはそれを上回る解の品質を達成できるか。
RQ2どのEASバリアント（Emb、Lay、Tab）がTSP、CVRP、JSSPのランタイムと解の品質の間で最良のトレードオフを提供するか。
RQ3EAS手法はトレーニング時に見たより大きなインスタンスへの一般化にどう影響するか。
RQ4EAS手法はCVRPとJSSPでLKH3のような強力なソルバーをML構築法で上回れるか。

主な発見

問題	インスタンスセット	n	手法	目的（Avg）	Best/Opt までの差（％）	時間（Wall）	ノート
TSP	Testing (10k inst.)	100	Concorde	7.765	0.000%	82M	正確解法；ベースライン
TSP	Testing (10k inst.)	100	LKH3	7.765	0.000%	8H	ヒューリスティック解法；ベースライン
TSP	Testing (10k inst.)	100	POMO-Greedy	7.776	0.146%	1M	POMOファミリのグリーディー系ベースライン
TSP	Testing (10k inst.)	100	POMO-Sampling	7.770	0.074%	4H	POMOファミリのサンプリング系ベースライン
TSP	Testing (10k inst.)	100	Active Search	7.768	0.046%	5D	オリジナルのアクティブ検索；高コスト
TSP	Testing (10k inst.)	100	EAS-Emb	7.769	0.063%	5H	EAS埋め込み更新
TSP	Testing (10k inst.)	100	EAS-Lay	7.769	0.053%	7H	EAS追加層更新
TSP	Testing (10k inst.)	100	EAS-Tab	7.768	0.048%	5H	EAS表更新
CVRP	Testing (10k inst.)	100	LKH3	15.65	0.00%	6D	CVRPの基準LKH3
CVRP	Testing (10k inst.)	100	POMO-Greedy	15.76	0.76%	2M	グリーディー基準値
CVRP	Testing (10k inst.)	100	POMO-Sampling	15.67	0.17%	7H	サンプリング基準値
CVRP	Testing (10k inst.)	100	Active Search	15.63	-0.07%	8D	オリジナルのアクティブ検索；遅い
CVRP	Testing (10k inst.)	100	EAS-Emb	15.63	-0.08%	9H	EAS埋め込み更新
CVRP	Testing (10k inst.)	100	EAS-Lay	15.61	-0.23%	12H	EAS追加層更新
CVRP	Testing (10k inst.)	100	EAS-Tab	15.62	-0.14%	8H	EAS表更新
JSSP	Testing (100 inst.)	10x10	OR-Tools	807.6	0.0%	37S	基準 OR-Tools
JSSP	Testing (100 inst.)	10x10	L2D-Greedy	988.6	22.3%	20S	基準 L2D グリーディー
JSSP	Testing (100 inst.)	10x10	L2D-Sampling	871.7	8.0%	8H	サンプリング基準値
JSSP	Testing (100 inst.)	10x10	Active Search	854.2	5.8%	8H	オリジナルのアクティブ検索
JSSP	Testing (100 inst.)	10x10	EAS-Emb	837.0	3.7%	7H	EAS埋め込み更新
JSSP	Testing (100 inst.)	10x10	EAS-Lay	859.6	6.5%	7H	EAS追加層更新
JSSP	Testing (100 inst.)	10x10	EAS-Tab	860.2	6.5%	8H	EAS表更新

EASバリアントはフルアクティブ検索と比較して実行時間を大幅に削減しつつ、解の品質を維持または向上させる。
TSPではEAS-Emb、EAS-Lay、EAS-TabがConcorde/LKH3へのギャップを、アクティブ検索と同等かそれ以上にしつつ、実行時間を桁違いに速くする。
CVRPではEAS-Layがテストインスタンスで全ベースライン（LKH3を含む）を上回り、EAS-Tabは高速な実行時間で強い性能を達成するが、αに対して感度があり一部インスタンスで調整が必要。
JSSPではEAS-EmbがEASバリアントの中で最良の性能を示し、サンプリングに対するギャップを大幅に減らす；EAS-Layはアクティブ検索と競合し得る；EAS-Tabはより大きなインスタンスで遅れを取る。
問題を跨いで、EASアプローチは訓練を再実行せずに効果的な探索指針を可能にすることで大規模インスタンスへの一般化を改善する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。