[논문 리뷰] DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization
DIFUSCO는 그래프 기반의 이산 확산 모델을 도입해 NP-hard 조합 최적화 문제를 해결하고, 병렬 노이즈 제거와 다중 모드 해법 생성을 통해 TSP와 MIS에서 최첨단 성과를 달성합니다.
Neural network-based Combinatorial Optimization (CO) methods have shown promising results in solving various NP-complete (NPC) problems without relying on hand-crafted domain knowledge. This paper broadens the current scope of neural solvers for NPC problems by introducing a new graph-based diffusion framework, namely DIFUSCO. Our framework casts NPC problems as discrete {0, 1}-vector optimization problems and leverages graph-based denoising diffusion models to generate high-quality solutions. We investigate two types of diffusion models with Gaussian and Bernoulli noise, respectively, and devise an effective inference schedule to enhance the solution quality. We evaluate our methods on two well-studied NPC combinatorial optimization problems: Traveling Salesman Problem (TSP) and Maximal Independent Set (MIS). Experimental results show that DIFUSCO strongly outperforms the previous state-of-the-art neural solvers, improving the performance gap between ground-truth and neural solvers from 1.76% to 0.46% on TSP-500, from 2.46% to 1.17% on TSP-1000, and from 3.19% to 2.58% on TSP10000. For the MIS problem, DIFUSCO outperforms the previous state-of-the-art neural solver on the challenging SATLIB benchmark.
연구 동기 및 목표
- 그래프 기반 확산 프레임워크를 도입하여 자가회귀 및 RL 기반 방법을 넘어 신경망 CO 솔루션을 확장한다.
- NPC 문제를 {0,1}-값 벡터로 표현하고 그래프에서의 확산 디노이징을 사용해 고품질 해를 생성한다.
- 가우시안(연속) 대 베르누이(이산) 확산을 비교하고 효과적인 추론 스케줄을 식별한다.
- 대형 TSP 인스턴스와 MIS 벤치마크에서 확장성과 강력한 성능을 보여준다.
제안 방법
- NPC 문제를 그래프 구조의 인스턴스에 대한 {0,1}-벡터 최적화로 형식화한다.
- 그래프 신경망(비등방성 GNN)을 사용해 인스턴스를 인코딩하고 확산 프레임워크에서 부정확해진 {0,1} 변수의 노이즈를 제거한다.
- Bernoulli 노이즈를 사용한 이산 확산과 Gaussian 노이즈를 사용한 연속 확산을 탐구하고 RL이 아닌 지도학습 디노이징으로 학습한다.
- 품질을 유지하면서 단계 수를 줄이기 위해 이산 확산에 DDIM 유사 스케줄(선형 및 코사인)을 사용한 빠른 추론을 설계한다.
- 해 interpreted를 heatmaps로 디코딩하고 문제 특화 전략(TSP의 2-opt를 통한 탐욕적 방법; MIS를 위한 탐욕적 방법)으로 다수의 샘플을 수행한다.

실험 결과
연구 질문
- RQ1그래프 기반 확산 모델이 NPC 문제에 대해 고품질의 다중모드 해를 생성할 수 있는가?
- RQ2그래프 기반 CO 작업에서 이산 Bernoulli 확산과 연속 Gaussian 확산은 어떻게 비교되는가?
- RQ3TSP와 MIS에 대해 어떤 추론 스케줄과 디코딩 전략이 최상의 성능과 효율을 제공하는가?
- RQ4하나의 규모에서 학습된 DIFUSCO 모델이 더 큰 TSP 인스턴스나 서로 다른 MIS 벤치마크에 일반화되는가?
주요 결과
| 알고리즘 | 유형 | TSP-50 길이 | TSP-50 간격 | TSP-100 길이 | TSP-100 간격 |
|---|---|---|---|---|---|
| Concorde ∗ | Exact | 5.69 | 0.00 | 7.76 | 0.00 |
| 2-OPT | Heuristics | 5.86 | 2.95 | 8.03 | 3.54 |
| AM | Greedy | 5.80 | 1.76 | 8.12 | 4.53 |
| GCN | Greedy | 5.87 | 3.10 | 8.41 | 8.38 |
| Transformer | Greedy | 5.71 | 0.31 | 7.88 | 1.42 |
| POMO | Greedy | 5.73 | 0.64 | 7.84 | 1.07 |
| Sym-NCO | Greedy | - | - | 7.84 | 0.94 |
| DPDP | $1k$-Improvements | 5.70 | 0.14 | 7.89 | 1.62 |
| Ours | Greedy † | 5.70 | 0.10 | 7.78 | 0.24 |
| AM | $1k\times$ Sampling | 5.73 | 0.52 | 7.94 | 2.26 |
| GCN | $2k\times$ Sampling | 5.70 | 0.01 | 7.87 | 1.39 |
| Transformer | $2k\times$ Sampling | 5.69 | 0.00 | 7.76 | 0.39 |
| POMO | $8\times$ Augment | 5.69 | 0.03 | 7.77 | 0.14 |
| Sym-NCO | $100\times$ Sampling | - | - | 7.79 | 0.39 |
| MDAM | $50\times$ Sampling | 5.70 | 0.03 | 7.79 | 0.38 |
| Ours | $16\times$ Sampling | 5.69 | -0.01 | 7.76 | -0.01 |
- 이산 확산은 NPC 문제에서 몇 차례의 확산 단계를 넘길 때 연속 확산보다 현저히 뛰어나다.
- 코사인 디노이징 스케줄은 이산 확산에서 선형보다 우수하며, 품질을 유지한 채 빠른 추론을 가능하게 한다.
- TSP의 경우, DIFUSCO는 TSP-500에서 MCTS를 사용했을 때 그로부터 1.76% 포인트 차이를 0.46%로 줄이고, TSP-1000에서 2.46%에서 1.17%로 줄이며, TSP-10000에서 3.19%에서 2.58%로 줄인다.
- SATLIB 벤치마크의 MIS에서 DIFUSCO는 기존 신경망 해법들에 비해 최첨단 성능을 달성한다.
- 하나의 비등방성 GNN 백본으로 동일 프레임워크 내에서 TSP와 MIS를 모두 해결할 수 있다.
- DIFUSCO는 TSP 규모에 걸쳐 일반화가 잘되며, 교차 규모 테스트에서 RL또는 SL로 학습된 비자가 자동회귀적 방법들보다 종종 우수하다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.