QUICK REVIEW

[论文解读] DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization

Zhiqing Sun, Yiming Yang|arXiv (Cornell University)|Feb 16, 2023

Machine Learning and Algorithms被引用 20

一句话总结

DIFUSCO 引入基于图的离散扩散模型来解决 NP-hard 的组合优化问题，在通过并行去噪和多模态解生成方面在 TSP 和 MIS 上取得了最先进的结果。

ABSTRACT

Neural network-based Combinatorial Optimization (CO) methods have shown promising results in solving various NP-complete (NPC) problems without relying on hand-crafted domain knowledge. This paper broadens the current scope of neural solvers for NPC problems by introducing a new graph-based diffusion framework, namely DIFUSCO. Our framework casts NPC problems as discrete {0, 1}-vector optimization problems and leverages graph-based denoising diffusion models to generate high-quality solutions. We investigate two types of diffusion models with Gaussian and Bernoulli noise, respectively, and devise an effective inference schedule to enhance the solution quality. We evaluate our methods on two well-studied NPC combinatorial optimization problems: Traveling Salesman Problem (TSP) and Maximal Independent Set (MIS). Experimental results show that DIFUSCO strongly outperforms the previous state-of-the-art neural solvers, improving the performance gap between ground-truth and neural solvers from 1.76% to 0.46% on TSP-500, from 2.46% to 1.17% on TSP-1000, and from 3.19% to 2.58% on TSP10000. For the MIS problem, DIFUSCO outperforms the previous state-of-the-art neural solver on the challenging SATLIB benchmark.

研究动机与目标

通过引入基于图的扩散框架，拓展神经 CO 解决方案，超越自回归和基于强化学习的方法。
将 NPC 问题表述为 {0,1}-值向量，并在图上使用扩散去噪来生成高质量解。
比较高斯（连续）扩散与伯努利（离散）扩散，并确定有效的推断计划。
展示在大规模 TSP 实例和 MIS 基准上的可扩展性与强性能。

提出的方法

将 NPC 问题表述为图结构实例上的 {0,1}-向量优化。
使用图神经网络（各向异性 GNN）对实例进行编码，并在扩散框架中对损坏的 {0,1} 变量进行去噪。
探索带伯努利噪声的离散扩散和带高斯噪声的连续扩散；使用有监督去噪进行训练（非 RL）。
为离散扩散设计类似 DDIM 的推理时间表（线性和余弦）以在减小步数的同时保持质量。
使用热力图和针对性策略解码解（TSP 使用贪心+2-opt；MIS 使用贪心），并执行多样本。

DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization

实验结果

研究问题

RQ1基于图的扩散模型能否为 NPC 问题生成高质量、多模态的解？
RQ2在基于图的 CO 任务中，离散伯努利扩散和连续高斯扩散有何比较？
RQ3哪种推断计划和解码策略能为 TSP 与 MIS 提供最佳性能与效率？
RQ4在一个尺度上训练的 DIFUSCO 模型是否能推广到更大型的 TSP 实例或不同的 MIS 基准？

主要发现

算法	类型	TSP-50 长度	TSP-50 差距	TSP-100 长度	TSP-100 差距
Concorde ∗	Exact	5.69	0.00	7.76	0.00
2-OPT	Heuristics	5.86	2.95	8.03	3.54
AM	Greedy	5.80	1.76	8.12	4.53
GCN	Greedy	5.87	3.10	8.41	8.38
Transformer	Greedy	5.71	0.31	7.88	1.42
POMO	Greedy	5.73	0.64	7.84	1.07
Sym-NCO	Greedy	-	-	7.84	0.94
DPDP	$1k$-Improvements	5.70	0.14	7.89	1.62
Ours	Greedy †	5.70	0.10	7.78	0.24
AM	$1k\times$ Sampling	5.73	0.52	7.94	2.26
GCN	$2k\times$ Sampling	5.70	0.01	7.87	1.39
Transformer	$2k\times$ Sampling	5.69	0.00	7.76	0.39
POMO	$8\times$ Augment	5.69	0.03	7.77	0.14
Sym-NCO	$100\times$ Sampling	-	-	7.79	0.39
MDAM	$50\times$ Sampling	5.70	0.03	7.79	0.38
Ours	$16\times$ Sampling	5.69	-0.01	7.76	-0.01

离散扩散在使用超过少数扩散步骤时，显著优于用于 NPC 问题的连续扩散。
余弦去噪计划在离散扩散中优于线性；实现快速推理且保持良好质量。
在 TSP 上，DIFUSCO 将与真实解的差距从 1.76% 收敛到 0.46%（含 MCTS）在 TSP-500；从 2.46% 收敛到 1.17%（TSP-1000）；从 3.19% 收敛到 2.58%（TSP-10000）。
在 SATLIB 基准的 MIS 上，DIFUSCO 相对于之前的神经求解器达到最先进的性能。
单一个各向异性 GNN 主干即可在同一框架中求解 TSP 与 MIS。
DIFUSCO 在跨尺度测试中对 TSP 各尺度具有良好的一般化能力，通常超过通过 RL 或 SL 训练的非自回归方法。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。