Skip to main content
QUICK REVIEW

[논문 리뷰] Efficient Active Search for Combinatorial Optimization Problems

André Hottung, Yeong‐Dae Kwon|arXiv (Cornell University)|2021. 06. 09.
Metaheuristic Optimization Algorithms Research참고 문헌 28인용 수 27
한 줄 요약

세 가지 효율적인 활성 탐색(EAS) 전략을 제안하여 검색 중 모델 파라미터의 하위 집합만 업데이트하고, TSP, CVRP, JSSP에 대한 ML 기반 구성 방법의 성능을 향상시키며 종종 최첨단 ML 방법과 때때로 LKH3를 능가한다.

ABSTRACT

Recently numerous machine learning based methods for combinatorial optimization problems have been proposed that learn to construct solutions in a sequential decision process via reinforcement learning. While these methods can be easily combined with search strategies like sampling and beam search, it is not straightforward to integrate them into a high-level search procedure offering strong search guidance. Bello et al. (2016) propose active search, which adjusts the weights of a (trained) model with respect to a single instance at test time using reinforcement learning. While active search is simple to implement, it is not competitive with state-of-the-art methods because adjusting all model weights for each test instance is very time and memory intensive. Instead of updating all model weights, we propose and evaluate three efficient active search strategies that only update a subset of parameters during the search. The proposed methods offer a simple way to significantly improve the search performance of a given model and outperform state-of-the-art machine learning based methods on combinatorial problems, even surpassing the well-known heuristic solver LKH3 on the capacitated vehicle routing problem. Finally, we show that (efficient) active search enables learned models to effectively solve instances that are much larger than those seen during training.

연구 동기 및 목표

  • Bello 등 활성 탐색의 높은 계산비용을 효율적인 대안으로 제시하여 동기를 부여하고 해결책을 제시한다.
  • 테스트 시간 탐색 중에 모델 파라미터의 하위 집합만 업데이트하기 위한 세 가지 전략을 개발한다.
  • EAS 변형이 여러 조합 최적화 문제에서 솔루션 품질과 일반화를 향상시킴을 보여준다.
  • CVRP 및 JSSP에서 상태의 예측 솔버를 능가하고 강력한 휴리스틱(LKH3)보다도 좋을 수 있음을 보여준다.

제안 방법

  • 세 가지 EAS 변형을 정의한다: 임베딩 업데이트(EAS-Emb), 추가 레이어 업데이트(EAS-Lay), 표 업데이트(EAS-Tab).
  • 각 변형은 검색 중에 나머지 모델을 고정하고 인스턴스별 소형 구성을 업데이트한다.
  • 업데이트를 안내하기 위해 RL 및 모방 학습 손실을 사용한다: REINFORCE 기반의 L_RL과 incumbent 최적 해의 모방에서 오는 L_IL을 결합하여 L_RIL = L_RL + λ L_IL로 정의한다.
  • EAS-Emb의 경우: 인스턴스 임베딩의 부분 집합에 대해 기울기로 업데이트를 수행한다; EAS-Lay의 경우: 인스턴스별 잔차 레이어를 삽입하고 그 가중치를 학습한다; EAS-Tab의 경우: 역전파 없이 행동 확률에 영향을 미치는 룩업 테이블을 조정한다.
  • TSP(POMO 기반), CVRP(POMO 기반), JSSP(L2D 기반)에서 평가하고 Concorde, LKH3, 그리고 여러 ML 기초선과 비교한다.

실험 결과

연구 질문

  • RQ1효율적인 활성 탐색(일부 매개변수만 업데이트)이 전체 활성 탐색과 동등하거나 더 우수한 솔루션 품질을 달성할 수 있는가?
  • RQ2어떤 EAS 변형(Emb, Lay, Tab)이 TSP, CVRP, JSSP 전반에 걸쳐 런타임과 솔루션 품질 사이의 가장 좋은 트레이드오프를 제공하는가?
  • RQ3EAS 방법이 학습 중에 본 larger 인스턴스에 대한 일반화에 어떤 영향을 미치는가?
  • RQ4EAS 방법이 CVRP 및 JSSP에서 ML 구성 방법이 강력한 해결사(LKH3)보다 우수하도록 할 수 있는가?

주요 결과

문제인스턴스 세트n방법목표(평균)최적/최고 대비 차이 (%)소요 시간(벽)메모
TSPTesting (10k inst.)100Concorde7.7650.000%82MExact solver; baseline
TSPTesting (10k inst.)100LKH37.7650.000%8HHeuristic solver; baseline
TSPTesting (10k inst.)100POMO-Greedy7.7760.146%1MGreedy baseline from POMO family
TSPTesting (10k inst.)100POMO-Sampling7.7700.074%4HSampling baseline from POMO family
TSPTesting (10k inst.)100Active Search7.7680.046%5DOriginal active search; high cost
TSPTesting (10k inst.)100EAS-Emb7.7690.063%5HEAS embedding updates
TSPTesting (10k inst.)100EAS-Lay7.7690.053%7HEAS added-layer updates
TSPTesting (10k inst.)100EAS-Tab7.7680.048%5HEAS tabular updates
CVRPTesting (10k inst.)100LKH315.650.00%6DBaseline LKH3 on CVRP
CVRPTesting (10k inst.)100POMO-Greedy15.760.76%2MGreedy baseline
CVRPTesting (10k inst.)100POMO-Sampling15.670.17%7HSampling baseline
CVRPTesting (10k inst.)100Active Search15.63-0.07%8DOriginal active search; slower
CVRPTesting (10k inst.)100EAS-Emb15.63-0.08%9HEAS embedding updates
CVRPTesting (10k inst.)100EAS-Lay15.61-0.23%12HEAS added-layer updates
CVRPTesting (10k inst.)100EAS-Tab15.62-0.14%8HEAS tabular updates
JSSPTesting (100 inst.)10x10OR-Tools807.60.0%37SBaseline OR-Tools
JSSPTesting (100 inst.)10x10L2D-Greedy988.622.3%20SBaseline L2D greedy
JSSPTesting (100 inst.)10x10L2D-Sampling871.78.0%8HSampling baseline
JSSPTesting (100 inst.)10x10Active Search854.25.8%8HOriginal active search
JSSPTesting (100 inst.)10x10EAS-Emb837.03.7%7HEAS embedding updates
JSSPTesting (100 inst.)10x10EAS-Lay859.66.5%7HEAS added-layer updates
JSSPTesting (100 inst.)10x10EAS-Tab860.26.5%8HEAS tabular updates
  • EAS 변형은 전체 활성 탐색에 비해 런타임을 크게 단축하면서도 솔루션 품질을 유지하거나 향상시킨다.
  • TSP에서 EAS-Emb, EAS-Lay, EAS-Tab은 Concorde/LKH3에 대한 간격이 활성 탐색과 비교되거나 더 나으며 실행 시간은 수 배 빠르다.
  • CVRP에서 EAS-Lay는 테스트 인스턴스에서 모든 기초선(LKH3 포함)보다 우수한 성능을 보이며, EAS-Tab은 더 빠른 런타임으로 강한 성능을 달성하지만 α에 민감하여 일부 인스턴스에 대해 조정이 필요하다.
  • JSSP에서 EAS-Emb가 EAS 변형 중 최상의 성능을 보이며 샘플링에 비해 간극을 크게 줄이고, EAS-Lay는 활성 탐색에 비해 경쟁력이 있으며, EAS-Tab은 더 큰 인스턴스에서 뒤처진다.
  • 문제 전반에 걸쳐 EAS 접근법은 전체 모델 재학습 없이 효과적인 탐색 안내를 가능하게 하여 더 큰 인스턴스에 대한 일반화를 개선한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.