QUICK REVIEW

[論文レビュー] Neural Large Neighborhood Search for the Capacitated Vehicle Routing Problem

André Hottung, Kevin Tierney|arXiv (Cornell University)|Nov 21, 2019

Vehicle Routing Optimization Methods参考文献 31被引用数 60

ひとこと要約

NLNSは学習済み修復ヒューリスティクスを大規模近傍探索に統合し、CVRPとSDVRPを解く。既存のML手法を上回り、最先端の最適化手法に接近する。

ABSTRACT

Learning how to automatically solve optimization problems has the potential to provide the next big leap in optimization technology. The performance of automatically learned heuristics on routing problems has been steadily improving in recent years, but approaches based purely on machine learning are still outperformed by state-of-the-art optimization methods. To close this performance gap, we propose a novel large neighborhood search (LNS) framework for vehicle routing that integrates learned heuristics for generating new solutions. The learning mechanism is based on a deep neural network with an attention mechanism and has been especially designed to be integrated into an LNS search setting. We evaluate our approach on the capacitated vehicle routing problem (CVRP) and the split delivery vehicle routing problem (SDVRP). On CVRP instances with up to 297 customers, our approach significantly outperforms an LNS that uses only handcrafted heuristics and a well-known heuristic from the literature. Furthermore, we show for the CVRP and the SDVRP that our approach surpasses the performance of existing machine learning approaches and comes close to the performance of state-of-the-art optimization approaches.

研究の動機と目的

VRP解法性能を向上させるために、ハイレベルなメタヒューリスティック内で学習ベースのヒューリスティクスの利用を動機づける。
大規模近傍探索の中で、不完全に破壊された解を処理できるニューラル修復演算子を開発する。
GPUの並列性と問題に依存しないdestroy/repairコンポーネントを活用して、CVRPおよびSDVRPのスケーラブルな解決を可能にする。
NLNSを最先端のML手法と従来の最適化ソルバーと比較評価し、性能向上を定量化する。

提案手法

注意機構を用いたニューラルネットワークを用いて、破壊されたVRP解を修復する大規模近傍探索NLNSを提案する。
不完全解を生み出すために、2つの単純な破壊演算子（ポイントベースとツアーベース）を実装する。
実現可能性制約の下で不完全なツアーの端点を結ぶよう、方策勾配強化学習を用いてニューラル修復モデルを訓練する。
注意ベースの埋め込みを用いたGPU加速アーキテクチャを使用して、不完全なツアーを修復するための行動確率を計算する。
特定の問題特性に合わせて修復演算子をインスタンス分布上で訓練する。
NLNSをバッチおよび単一インスタンス探索モードで評価し、MLベースラインおよび最適化ソルバーと比較する。

実験結果

リサーチクエスチョン

RQ1NLNSで学習した修復演算子は、CVRP/SDVRPの大規模近傍探索における手作業で設計された修復よりも優れることができるか？
RQ2CVRP/SDVRPにおける解の品質と実行時間の観点で、NLNSは既存のMLアプローチ（AM, RL-BS）とどのように比較されるか？
RQ3破壊/修復設計とGPU加速アーキテクチャが、より大規模なCVRP/SDVRPインスタンスへのスケーラビリティに与える影響は？
RQ4学習された修復は、CVRPおよびSDVRPにおける最先端の最適化手法の性能に近づくか？
RQ5バッチモードと単一インスタンス探索モードの解の品質と効率にはどのような影響があるか？

主な発見

インスタンスセット	手法	平均コスト	総時間（秒）
CVRP	NLNS	6.19	431
CVRP	AM	6.25	451
CVRP	RL-BS	6.40	2*
SDVRP	NLNS	6.15	611
SDVRP	AM	6.25	615
SDVRP	RL-BS	6.34	2*

NLNSは、手作業で設計された修復を用いるLNSおよび既存のMLアプローチをCVRP/SDVRPのインスタンス群で顕著に上回る。
最大100顧客のCVRP/SDVRPにおいて、NLNSは報告されたテストでAMおよびRL-BSより低い平均コストを達成する。
バッチNLNS（並列インスタンス解決）は、すべての評価インスタンスセット（CVRPおよびSDVRP）において、比較対象のMLベースラインより優れた性能を示す。
学習済み修復を用いた単一インスタンスNLNSは、報告された実験で最先端の最適化手法（UHGSおよびLKH3）の性能に近づくか、同等となる。
クリティックを用いた強化学習による修復の訓練は、学習を安定化させ、より大規模なインスタンスに一般化するスケーラブルな修復を生み出す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。