[论文解读] UPath: Universal Planner Across Topological Heterogeneity For Grid-Based Pathfinding
UPath 训练出一个通用校正因子启发式,用于 A*,在多样化的网格拓扑上具有泛化能力,在未见任务分布上实现最多 2.2x 的较少扩展,同时成本保持在接近最优的约 3%。
The performance of search algorithms for grid-based pathfinding, e.g. A*, critically depends on the heuristic function that is used to focus the search. Recent studies have shown that informed heuristics that take the positions/shapes of the obstacles into account can be approximated with the deep neural networks. Unfortunately, the existing learning-based approaches mostly rely on the assumption that training and test grid maps are drawn from the same distribution (e.g., city maps, indoor maps, etc.) and perform poorly on out-of-distribution tasks. This naturally limits their application in practice when often a universal solver is needed that is capable of efficiently handling any problem instance. In this work, we close this gap by designing an universal heuristic predictor: a model trained once, but capable of generalizing across a full spectrum of unseen tasks. Our extensive empirical evaluation shows that the suggested approach halves the computational effort of A* by up to a factor of 2.2, while still providing solutions within 3% of the optimal cost on average altogether on the tasks that are completely different from the ones used for training $\unicode{x2013}$ a milestone reached for the first time by a learnable solver.
研究动机与目标
- 在网格基路径搜索中强调实例感知启发式的必要性,以减少搜索扩展。
- 提出一个一次性训练的通用启发式预测器,可在分布外地图上实现泛化。
- 将校正因子启发式与标准 A* 规划器集成,而不改变搜索过程。
- 在多样化且拓扑丰富的基准(UPF)上评估泛化能力,并与基线进行比较。
提出的方法
- 定义校正因子 cf*(n) = h_oct(n) / h*(n),其中 h_oct 是八分法则启发式,h* 是从目标点的 Dijkstra 过程得到的真实代价到达值。
- 使用编码器–Transformer–解码器网络及长跳跃连接预测稠密 cf(n) 映射,并通过掩蔽回归损失学习 cf*(n)(仅对非障碍、非目标格)。
- 将预测的 cf 转换为可用的启发式 h_hat(n) = h_oct(n) / max(cf_hat(n), epsilon),用于 A* 指引。
- 在简单的过程先验(Uniform、Beta、Beta-Figures)上训练三种模型,以促进普适性并避免对单一拓扑结构的过拟合。
- 创建 UPF,一个包含 20,000 个任务、覆盖 10 种拓扑类型的评估套件,以测试跨域泛化性与鲁棒性。
实验结果
研究问题
- RQ1一个单一的神经启发式是否能在大量未见网格拓扑和分布上实现泛化?
- RQ2在分布转移条件下,通用预测器与传统的 A*、加权 A* 以及最新的学习规划器相比,表现如何?
- RQ3方法能否扩展到更大网格(如 128x128)并保持高效与接近最优性?
- RQ4哪些设计选择(如跳跃连接、损失掩蔽)对稳健的通用性能至关重要?
主要发现
- UPath 在 UPF 任务上将搜索扩展减少至原生 A* 的最多 2.2 倍。
- 求解路径仍接近最优,平均成本约比最优高出约 3%。
- Beta+Fig 变体在总体权衡中表现最佳,找到最优解占比 72.63%,成本为 101.1% ± 4.1,总扩展为 47.4% ± 27.7。
- Beta 变体达到最低扩展(45.3% ±31.9),但成本较高(105.1% ±16.2),最优解比例较低(55.24%)。
- 与加权 A* 相比,较高的权重能减少扩展但会降低最优性并抬高代价;TransPath 在 UPF 上因对评估分布敏感而表现较差。
- UPath 在拓扑多样的 UPF 基准上优于 WA* 基线和 TransPath,展现出稳健的泛化性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。