[论文解读] Neural Large Neighborhood Search for the Capacitated Vehicle Routing Problem
NLNS 将学习型修复启发式方法整合到大规模邻域搜索中,以解决 CVRP 和 SDVRP,超越现有的 ML 方法并接近最先进的优化方法。
Learning how to automatically solve optimization problems has the potential to provide the next big leap in optimization technology. The performance of automatically learned heuristics on routing problems has been steadily improving in recent years, but approaches based purely on machine learning are still outperformed by state-of-the-art optimization methods. To close this performance gap, we propose a novel large neighborhood search (LNS) framework for vehicle routing that integrates learned heuristics for generating new solutions. The learning mechanism is based on a deep neural network with an attention mechanism and has been especially designed to be integrated into an LNS search setting. We evaluate our approach on the capacitated vehicle routing problem (CVRP) and the split delivery vehicle routing problem (SDVRP). On CVRP instances with up to 297 customers, our approach significantly outperforms an LNS that uses only handcrafted heuristics and a well-known heuristic from the literature. Furthermore, we show for the CVRP and the SDVRP that our approach surpasses the performance of existing machine learning approaches and comes close to the performance of state-of-the-art optimization approaches.
研究动机与目标
- 在一个高层元启发式框架中倡导使用基于学习的启发式方法,以提升 VRP 求解性能。
- 开发一个神经修复算子,能够在大邻域搜索中处理不完整的破坏解。
- 通过利用 GPU 并行性以及与问题无关的破坏/修复组件,实现 CVRP 和 SDVRP 的可扩展求解。
- 将 NLNS 与最先进的 ML 方法和传统优化求解器进行对比评估,以量化性能提升。
提出的方法
- 提出 NLNS,一种使用带注意力的神经网络来修复被破坏的 VRP 解的大邻域搜索。
- 实现两种简单的破坏算子(基于点和基于路径)以生成不完整解。
- 通过策略梯度强化学习训练神经修复模型,在可行性约束下连接不完整路径的端点。
- 使用带注意力嵌入的 GPU 加速架构来计算修复不完整路径的动作概率。
- 在实例分布上训练修复算子,以针对特定问题特征定制修复。
- 在批量和单实例搜索模式下评估 NLNS,并与 ML 基线和优化求解器进行比较。
实验结果
研究问题
- RQ1NLNS 学习型修复算子是否能在 CVRP/SDVRP 的大邻域搜索中超越手工修复?
- RQ2在解质量和运行时间方面,NLNS 与现有 ML 方法(AM、RL-BS)在 CVRP/SDVRP 上的比较如何?
- RQ3破坏/修复设计和 GPU 加速架构对扩大到更大规模的 CVRP/SDVRP 实例的可扩展性有什么影响?
- RQ4学习到的修复是否接近最先进的优化方法在 CVRP 与 SDVRP 上的性能?
- RQ5批量搜索模式与单实例搜索模式如何影响解质量和效率?
主要发现
| 实例集 | 方法 | 平均成本 | 总时间(s) |
|---|---|---|---|
| CVRP | NLNS | 6.19 | 431 |
| CVRP | AM | 6.25 | 451 |
| CVRP | RL-BS | 6.40 | 2* |
| SDVRP | NLNS | 6.15 | 611 |
| SDVRP | AM | 6.25 | 615 |
| SDVRP | RL-BS | 6.34 | 2* |
- NLNS 在 CVRP/SDVRP 实例集上显著超过手工修复的 LNS 与现有 ML 方法。
- 在最多 100 个客户的 CVRP/SDVRP 上,NLNS 在报道的测试中实现的平均成本低于 AM 和 RL-BS。
- 批量 NLNS(并行实例求解)在所有测试的实例集(CVRP 和 SDVRP)中均显示出优于所比较的 ML 基线的性能。
- 在报道的实验中,带有学习修复的单实例 NLNS 已接近或达到最先进的优化方法(UHGS 和 LKH3)的性能。
- 通过带评估器的强化学习训练修复可以稳定学习并产生可扩展的修复,能泛化到更大的实例。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。