Skip to main content
QUICK REVIEW

[論文レビュー] NeuroLKH: Combining Deep Learning Model with Lin-Kernighan-Helsgaun Heuristic for Solving the Traveling Salesman Problem

Liang Xin, Wen Song|arXiv (Cornell University)|Oct 15, 2021
Vehicle Routing Optimization Methods参考文献 34被引用数 44
ひとこと要約

NeuroLKHはSparse Graph NetworkをLin-Kernighan-Helsgaunソルバーと組み合わせてエッジスコアとノードペナルティを学習し、LKHを導いてTSPソリューションを改善し、関連ルーティング問題へ拡張します。

ABSTRACT

We present NeuroLKH, a novel algorithm that combines deep learning with the strong traditional heuristic Lin-Kernighan-Helsgaun (LKH) for solving Traveling Salesman Problem. Specifically, we train a Sparse Graph Network (SGN) with supervised learning for edge scores and unsupervised learning for node penalties, both of which are critical for improving the performance of LKH. Based on the output of SGN, NeuroLKH creates the edge candidate set and transforms edge distances to guide the searching process of LKH. Extensive experiments firmly demonstrate that, by training one model on a wide range of problem sizes, NeuroLKH significantly outperforms LKH and generalizes well to much larger sizes. Also, we show that NeuroLKH can be applied to other routing problems such as Capacitated Vehicle Routing Problem (CVRP), Pickup and Delivery Problem (PDP), and CVRP with Time Windows (CVRPTW).

研究の動機と目的

  • 純粋に手作業で構成されたエッジ候補セットとLKHの各インスタンスのサブグラデント最適化の限界を動機づけ、対処する。
  • TSPインスタンスのエッジスコアとノードペナルティを生成する学習ベースのモジュール(SGN)を開発する。
  • エッジ距離を変換し候補エッジを洗練させることにより、LKHへの素早く一般化されたガイダンスを可能にする。
  • サイズと分布を超えてLKHおよびVSR-LKHに対して顕著な性能向上を示し、CVRP、PDP、CVRPTWへ拡張する。

提案手法

  • TSPインスタンスを疎な有向グラフとして表現し、Sparse Graph Network(SGN)を適用してエッジスコアとノードペナルティを生成する。
  • 最適経路のエッジをターゲットとして監視付き学習を用いてエッジスコアを訓練する。
  • 最小1木の次数を2へ向けるよう導くノードペナルティを教師なし学習で訓練し、サブグラデント最適化に類似させる。
  • learned penaltiesを用いて cij = sij + pi + pj のようにエッジ距離を変換し、最適経路を保ちながら探索ガイダンスを改善する。
  • 学習済みエッジスコアに基づくノードごとのエッジ候補セットを作成し、LKHのlambda-opt探索を導く。
  • SGN出力が距離変換と候補セットを導くことで、複数のLKH試行を通じて解法を解く。インスタンスごとの最適化時間を削減する。

実験結果

リサーチクエスチョン

  • RQ1学習モデルは、従来のLKH生成セットよりも高品質なエッジ候補セットを生成するエッジスコアを出せるか。
  • RQ2エッジスコアとノードペナルティの同時学習は、さまざまなサイズと分布のTSPインスタンスに一般化できるか。
  • RQ3SGN誘導の距離変換をLKHと組み合わせることで、特に大規模問題で解の品質と実行時間が改善されるか。
  • RQ4NeuroLKHはCVRP、PDP、CVRPTWのような関連ルーティング問題へ効果的に拡張できるか。
  • RQ5高速なSGN推論と従来のLKHサブグラデント最適化の影響は全体的な性能にどのように現れるか。

主な発見

  • NeuroLKHはLKHおよびVSR-LKHを、トレーニングサイズ(100、200、500ノード)とタイムリミットの下で大幅に上回り、最適性ギャップを大幅に減少させる。
  • 単一のSGNがさまざまなサイズで訓練されると、より大きな問題(1000、2000、5000ノード)にも一般化し、ノードペナルティのファインチューニングが高速に行える。
  • SGN推論時間は問題サイズに対して概ね線形にスケールする(100〜5000ノードで3秒から208秒)、一方でLKHのサブグラデント最適化時間は超線形に増加するため、短時間リミット下でNeuroLKHは特に有利。
  • NeuroLKHはTSPLIBのユークリディアンインスタンスへも良く一般化し、多くのケースでLKHより難しいインスタンスを解くことが多く、混合訓練モデル(NeuroLKH_M)ではより大きい分布にも強い結果を示す。
  • NeuroLKHはエッジ候補セットを学習することでCVRP、PDP、CVRPTWへ拡張可能である(ノードペナルティはこれらの問題には適用されない)。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。