[论文解读] Unsupervised Learning for Solving the Travelling Salesman Problem
UTSP 使用无监督代理损失训练图神经网络,产生边概率热力图;再利用该热力图引导的局部搜索求解TSP,效率与精度高,优于先前的数据驱动方法。
We propose UTSP, an unsupervised learning (UL) framework for solving the Travelling Salesman Problem (TSP). We train a Graph Neural Network (GNN) using a surrogate loss. The GNN outputs a heat map representing the probability for each edge to be part of the optimal path. We then apply local search to generate our final prediction based on the heat map. Our loss function consists of two parts: one pushes the model to find the shortest path and the other serves as a surrogate for the constraint that the route should form a Hamiltonian Cycle. Experimental results show that UTSP outperforms the existing data-driven TSP heuristics. Our approach is parameter efficient as well as data efficient: the model takes $\sim$ 10\% of the number of parameters and $\sim$ 0.2\% of training samples compared with reinforcement learning or supervised learning methods.
研究动机与目标
- 用数据高效的无监督学习方法来激发解决欧几里得TSP的动机。
- 开发一个基于GNN的框架,生成引导解构的边热力图。
- 引入可微的代理损失函数,在最小化回路长度的同时强制哈密顿回路约束。
- 将热力图生成与最佳优先局部搜索结合,产生最终的TSP解。
- 在大规模TSP实例上展现相对于强化学习/监督学习基线的更优性能与效率。
提出的方法
- 从城市坐标构造距离矩阵D,并构建邻接权重W,其中W_{i,j}=exp(-D_{i,j}/tau)。
- 使用散射注意力GNN(SAG)通过对GNN输出S进行按列Softmax来得到转移矩阵T。
- 构建热力图H = T V T^T,其中V是Sylvester移位矩阵,用以编码哈密顿回路中边的参与概率。
- 使用一个无监督损失L进行训练,结合(i)对T的逐行约束,(ii)H中不允许自环,以及(iii)使用D和H最小化期望回路长度。
- 采用两阶段流程:(a) 从T构建热力图;(b) 以H引导的最佳优先局部搜索,得到最终TSP回路。
- 在搜索过程中使用类似反向传播的更新规则强化导致更好解的边,并引入随机性以丰富探索。
实验结果
研究问题
- RQ1无监督代理损失是否能够使GNN产生有信息性的边热力图,从而在没有标注最优解的情况下引导TSP求解器?
- RQ2使用带带通滤波的SAG是否比标准GCN产生更具表达力的热力图,从而提升搜索空间缩减与解质量?
- RQ3UTSP如何在推理时的热力图构建与局部搜索探索之间取得平衡,以在大规模TSP实例上实现具竞争力甚至更优的结果?
- RQ4学习得到的热力图在多大程度上相较于传统数据驱动基线降低搜索空间并提高解质量?
主要发现
- 在大型TSP实例(n=200、500、1000)上,UTSP实现的间距分别为0.0918%、0.8394%和1.1770%,总运行时间也比基线更快。
- UTSP所需训练样本远少于RL/SL方法(约2000个样本),参数数量也远少于RL/SL方法(例如44,392个),且收敛更快。
- 散射注意力GNN(SAG)产生的热力图H比GCN更具判别性且非光滑,从而实现更好的边优先级与局部搜索性能。
- UTSP预测的边集合Pi在经过适度训练后覆盖约98%的真实边(eta约在10轮后≈98%,使用SAG在100轮后≈99.76%;使用GCN约33.9%)。
- 基于热力图的代理损失将搜索空间从约4,950条边缩减到平均约583条边,有助于更快且更准确的搜索。
- 与Exact求解器及其他学习基线相比,UTSP在训练数据和时间大幅减少的情况下达到具有竞争力或更优的解质量。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。