[논문 리뷰] NeuroLKH: Combining Deep Learning Model with Lin-Kernighan-Helsgaun Heuristic for Solving the Traveling Salesman Problem
NeuroLKH는 Sparse Graph Network를 Lin-Kernighan-Helsgaun 해석자에 결합하여 간선 점수와 노드 페널티를 학습하고, LKH를 개선된 TSP 해법에 가이드하며 관련 라우팅 문제로 확장합니다.
We present NeuroLKH, a novel algorithm that combines deep learning with the strong traditional heuristic Lin-Kernighan-Helsgaun (LKH) for solving Traveling Salesman Problem. Specifically, we train a Sparse Graph Network (SGN) with supervised learning for edge scores and unsupervised learning for node penalties, both of which are critical for improving the performance of LKH. Based on the output of SGN, NeuroLKH creates the edge candidate set and transforms edge distances to guide the searching process of LKH. Extensive experiments firmly demonstrate that, by training one model on a wide range of problem sizes, NeuroLKH significantly outperforms LKH and generalizes well to much larger sizes. Also, we show that NeuroLKH can be applied to other routing problems such as Capacitated Vehicle Routing Problem (CVRP), Pickup and Delivery Problem (PDP), and CVRP with Time Windows (CVRPTW).
연구 동기 및 목표
- 순수하게 수작업으로 구성된 간선 후보 집합과 LKH의 인스턴스별 부분기울기 최적화의 한계를 동기 부여하고 해결합니다.
- TSP 인스턴스용 간선 점수와 노드 페널티를 생성하는 학습 기반 모듈(SGN)을 개발합니다.
- 간선 거리를 변환하고 후보 간선을 정제하여 LKH에 빠르고 일반화된 가이던스를 제공합니다.
- 크기와 분포에 걸쳐 LKH 및 VSR-LKH에 비해 의미 있는 성능 향상을 보이고, CVRP, PDP, CVRPTW로 확장합니다.
제안 방법
- TSP 인스턴스를 희소 방향 그래프로 표현하고 Sparse Graph Network (SGN)를 적용해 간선 점수와 노드 페널티를 생성합니다.
- 최적 경로 간선을 타깃으로 하여 감독 학습을 사용해 간선 점수를 학습합니다.
- 노드 페널티를 비지도 학습으로 학습하여 Minimum 1-Tree 차수를 2에 가깝게 유도하고 부분 그래디언트 최적화와 유사한 효과를냅니다.
- learned penalties를 사용하여 cij = sij + pi + pj로 간선 거리를 변환하고 최적의 경로를 보존하되 탐색 가이던스를 향상시킵니다.
- 학습된 간선 점수 기반으로 각 노드에 간선 후보 집합을 생성하여 LKH의 lambda-opt 탐색을 가이드합니다.
- SGN 출력이 거리 변환 및 후보 집합을 안내하는 여러 LKH 시도를 통해 인스턴스당 최적화 시간을 줄이며 해결합니다.
실험 결과
연구 질문
- RQ1학습된 모델이 전통적인 LKH 생성 집합보다 더 높은 품질의 간선 후보 집합을 생성할 수 있는가?
- RQ2간선 점수와 노드 페널티의 동시 학습이 다양한 TSP 인스턴스 크기와 분포에 일반화될 수 있는가?
- RQ3SGN-가이드 거리 변환과 LKH의 결합이 특히 대규모 문제에서 해답 품질과 실행 시간을 개선하는가?
- RQ4NeuroLKH가 CVRP, PDP, CVRPTW와 같은 관련 라우팅 문제로 효과적으로 확장될 수 있는가?
- RQ5빠른 SGN 추론이 전통적인 LKH 부분그래디언트 최적화에 비해 전체 성능에 어떤 영향을 미치는가?
주요 결과
- NeuroLKH는 학습 크기(100, 200, 500 노드) 및 시간 제한 전반에 걸쳐 LKH 및 VSR-LKH보다 유의하게 우수하며 최적성 차이를 크게 줄입니다.
- 다양한 크기로 학습된 단일 SGN은 빠른 미세 조정의 노드 페널티로 훨씬 큰 문제(1000, 2000, 5000 노드)로 일반화됩니다.
- SGN의 추론 시간은 문제 크기에 따라 대략 선형으로 확장되며(100-5000 노드에서 3초에서 208초), LKH 부분그래디언트 최적화 시간은 초과적으로 증가하여 짧은 시간 제한에서 NeuroLKH의 이점을 크게 만듭니다.
- NeuroLKH는 TSPLIB 유클리드 인스턴스에 잘 일반화되며 많은 경우 LKH보다 더 어려운 인스턴스를 해결하고, 혼합 학습 모델(NeuroLKH_M)에서 더 큰 분포에 대해 강력한 결과를 보입니다.
- NeuroLKH는 간선 후보 집합을 학습하여 CVRP, PDP, CVRPTW로도 확장할 수 있으며(이 문제에는 노드 페널티가 적용되지 않음).
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.