[論文レビュー] Efficient Active Search for Combinatorial Optimization Problems
3つの効率的なアクティブ検索(EAS)戦略を提案し、検索中にモデルパラメータのサブセットのみを更新、TSP、CVRP、JSSPのMLベース構築法の性能を向上させ、最先端のML手法を上回ることが多く、時にはLKH3を上回る。
Recently numerous machine learning based methods for combinatorial optimization problems have been proposed that learn to construct solutions in a sequential decision process via reinforcement learning. While these methods can be easily combined with search strategies like sampling and beam search, it is not straightforward to integrate them into a high-level search procedure offering strong search guidance. Bello et al. (2016) propose active search, which adjusts the weights of a (trained) model with respect to a single instance at test time using reinforcement learning. While active search is simple to implement, it is not competitive with state-of-the-art methods because adjusting all model weights for each test instance is very time and memory intensive. Instead of updating all model weights, we propose and evaluate three efficient active search strategies that only update a subset of parameters during the search. The proposed methods offer a simple way to significantly improve the search performance of a given model and outperform state-of-the-art machine learning based methods on combinatorial problems, even surpassing the well-known heuristic solver LKH3 on the capacitated vehicle routing problem. Finally, we show that (efficient) active search enables learned models to effectively solve instances that are much larger than those seen during training.
研究の動機と目的
- Bello らのアクティブ検索の高い計算コストを効率的な代替案で動機づけ、解決を試みる。
- テスト時の探索中にモデルパラメータのサブセットのみを更新する3つの戦略を開発する。
- EASバリアントが複数の組合せ最適化問題で解の品質と一般化を向上させることを実証する。
- EASが最先端のMLベース手法を上回り、CVRPとJSSPで強力なヒューリスティック(LKH3)を上回ることがあることを示す。
提案手法
- 3つのEASバリアントを定義:埋め込み更新(EAS-Emb)、追加層更新(EAS-Lay)、表更新(EAS-Tab)。
- 各バリアントは探索中にモデルの残りを固定したまま、インスタンス固有の小さなコンポーネントを更新する。
- 更新を導くためにRLと模倣学習の損失を使用する:L_RLはREINFORCEに基づき、L_ILは incumbentsの最良解の模倣から得られる; L_RIL = L_RL + λ L_ILとして結合。
- EAS-Emb: インスタンス埋め込みの一部を勾配で更新する;EAS-Lay: インスタンス固有の残差層を挿入しその重みを訓練する;EAS-Tab: バックプロパゲーションなしにアクション確率に影響を与えるルックアップテーブルを調整する。
- TSP(POMOベース)、CVRP(POMOベース)、JSSP(L2Dベース)で評価;Concorde、LKH3、およびいくつかのMLベースのベースラインと比較。
実験結果
リサーチクエスチョン
- RQ1効率的なアクティブ検索(パラメータのサブセットのみ更新)が完全なアクティブ検索と同等またはそれを上回る解の品質を達成できるか。
- RQ2どのEASバリアント(Emb、Lay、Tab)がTSP、CVRP、JSSPのランタイムと解の品質の間で最良のトレードオフを提供するか。
- RQ3EAS手法はトレーニング時に見たより大きなインスタンスへの一般化にどう影響するか。
- RQ4EAS手法はCVRPとJSSPでLKH3のような強力なソルバーをML構築法で上回れるか。
主な発見
| 問題 | インスタンスセット | n | 手法 | 目的(Avg) | Best/Opt までの差(%) | 時間(Wall) | ノート |
|---|---|---|---|---|---|---|---|
| TSP | Testing (10k inst.) | 100 | Concorde | 7.765 | 0.000% | 82M | 正確解法;ベースライン |
| TSP | Testing (10k inst.) | 100 | LKH3 | 7.765 | 0.000% | 8H | ヒューリスティック解法;ベースライン |
| TSP | Testing (10k inst.) | 100 | POMO-Greedy | 7.776 | 0.146% | 1M | POMOファミリのグリーディー系ベースライン |
| TSP | Testing (10k inst.) | 100 | POMO-Sampling | 7.770 | 0.074% | 4H | POMOファミリのサンプリング系ベースライン |
| TSP | Testing (10k inst.) | 100 | Active Search | 7.768 | 0.046% | 5D | オリジナルのアクティブ検索;高コスト |
| TSP | Testing (10k inst.) | 100 | EAS-Emb | 7.769 | 0.063% | 5H | EAS埋め込み更新 |
| TSP | Testing (10k inst.) | 100 | EAS-Lay | 7.769 | 0.053% | 7H | EAS追加層更新 |
| TSP | Testing (10k inst.) | 100 | EAS-Tab | 7.768 | 0.048% | 5H | EAS表更新 |
| CVRP | Testing (10k inst.) | 100 | LKH3 | 15.65 | 0.00% | 6D | CVRPの基準LKH3 |
| CVRP | Testing (10k inst.) | 100 | POMO-Greedy | 15.76 | 0.76% | 2M | グリーディー基準値 |
| CVRP | Testing (10k inst.) | 100 | POMO-Sampling | 15.67 | 0.17% | 7H | サンプリング基準値 |
| CVRP | Testing (10k inst.) | 100 | Active Search | 15.63 | -0.07% | 8D | オリジナルのアクティブ検索;遅い |
| CVRP | Testing (10k inst.) | 100 | EAS-Emb | 15.63 | -0.08% | 9H | EAS埋め込み更新 |
| CVRP | Testing (10k inst.) | 100 | EAS-Lay | 15.61 | -0.23% | 12H | EAS追加層更新 |
| CVRP | Testing (10k inst.) | 100 | EAS-Tab | 15.62 | -0.14% | 8H | EAS表更新 |
| JSSP | Testing (100 inst.) | 10x10 | OR-Tools | 807.6 | 0.0% | 37S | 基準 OR-Tools |
| JSSP | Testing (100 inst.) | 10x10 | L2D-Greedy | 988.6 | 22.3% | 20S | 基準 L2D グリーディー |
| JSSP | Testing (100 inst.) | 10x10 | L2D-Sampling | 871.7 | 8.0% | 8H | サンプリング基準値 |
| JSSP | Testing (100 inst.) | 10x10 | Active Search | 854.2 | 5.8% | 8H | オリジナルのアクティブ検索 |
| JSSP | Testing (100 inst.) | 10x10 | EAS-Emb | 837.0 | 3.7% | 7H | EAS埋め込み更新 |
| JSSP | Testing (100 inst.) | 10x10 | EAS-Lay | 859.6 | 6.5% | 7H | EAS追加層更新 |
| JSSP | Testing (100 inst.) | 10x10 | EAS-Tab | 860.2 | 6.5% | 8H | EAS表更新 |
- EASバリアントはフルアクティブ検索と比較して実行時間を大幅に削減しつつ、解の品質を維持または向上させる。
- TSPではEAS-Emb、EAS-Lay、EAS-TabがConcorde/LKH3へのギャップを、アクティブ検索と同等かそれ以上にしつつ、実行時間を桁違いに速くする。
- CVRPではEAS-Layがテストインスタンスで全ベースライン(LKH3を含む)を上回り、EAS-Tabは高速な実行時間で強い性能を達成するが、αに対して感度があり一部インスタンスで調整が必要。
- JSSPではEAS-EmbがEASバリアントの中で最良の性能を示し、サンプリングに対するギャップを大幅に減らす;EAS-Layはアクティブ検索と競合し得る;EAS-Tabはより大きなインスタンスで遅れを取る。
- 問題を跨いで、EASアプローチは訓練を再実行せずに効果的な探索指針を可能にすることで大規模インスタンスへの一般化を改善する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。