[论文解读] EECBS: A Bounded-Suboptimal Search for Multi-Agent Path Finding
该论文提出 EECBS,一种用于多智能体路径规划(MAPF)的有界次优搜索算法,通过在线学习生成不可接纳启发式函数,利用显式估计搜索(EES)实现更快速的高层节点选择。EECBS 通过四项关键改进,在保证解的质量在最优解的 2% 以内的同时,能够在 1 分钟时限内求解最多达 1,000 名智能体的实例,优于当前最先进算法 ECBS、BCP-7 和 eMDD-SAT。
Multi-Agent Path Finding (MAPF), i.e., finding collision-free paths for multiple robots, is important for many applications where small runtimes are necessary, including the kind of automated warehouses operated by Amazon. CBS is a leading two-level search algorithm for solving MAPF optimally. ECBS is a bounded-suboptimal variant of CBS that uses focal search to speed up CBS by sacrificing optimality and instead guaranteeing that the costs of its solutions are within a given factor of optimal. In this paper, we study how to decrease its runtime even further using inadmissible heuristics. Motivated by Explicit Estimation Search (EES), we propose Explicit Estimation CBS (EECBS), a new bounded-suboptimal variant of CBS, that uses online learning to obtain inadmissible estimates of the cost of the solution of each high-level node and uses EES to choose which high-level node to expand next. We also investigate recent improvements of CBS and adapt them to EECBS. We find that EECBS with the improvements runs significantly faster than the state-of-the-art bounded-suboptimal MAPF algorithms ECBS, BCP-7, and eMDD-SAT on a variety of MAPF instances. We hope that the scalability of EECBS enables additional applications for bounded-suboptimal MAPF algorithms.
研究动机与目标
- 为解决在数百名智能体的大规模场景下,最优 MAPF 算法的可扩展性局限问题。
- 在保持解质量保证的前提下,减少有界次优 MAPF 的运行时间。
- 通过用显式估计搜索(EES)替代焦点搜索,改进 ECBS,并利用在线学习生成不可接纳启发式函数。
- 将近期 CBS 改进技术——冲突绕过、冲突优先级处理、对称性推理和 WDG 启发式函数——适配到新的 EECBS 框架中。
- 在多样化的 MAPF 基准测试集上,实证验证 EECBS 相较于 ECBS、BCP-7 和 eMDD-SAT 的优越性。
提出的方法
- EECBS 在高层搜索中用显式估计搜索(EES)替代 ECBS 中的焦点搜索,基于学习得到的不可接纳代价估计来优先选择节点。
- 采用在线学习动态估算每个高层节点下方的解的代价,从而在无需保证可接纳性的情况下实现更快收敛。
- 该算法集成了四项 CBS 改进技术:冲突绕过、冲突优先级处理、对称性推理,以及 WDG 启发式函数,以增强剪枝效果和搜索效率。
- 高层节点的扩展由使用学习得到的不可接纳启发式函数的 EES 指导,而低层路径规划则使用 A* 算法并结合约束以解决冲突。
- 解的代价被限制在用户指定的最优解倍数范围内,确保次优性保证。
- 该框架在六张标准 MAPF 基准地图上进行了评估,涵盖不同数量的智能体和次优性因子。
实验结果
研究问题
- RQ1在 ECBS 中用 EES 替代焦点搜索,是否能显著减少运行时间,同时保持有界次优性?
- RQ2在线学习在为 MAPF 中高层节点选择生成有用不可接纳启发式函数方面是否有效?
- RQ3标准 CBS 改进技术(如冲突绕过、对称性推理)是否能有效迁移至 EECBS 框架?
- RQ4EECBS 在性能和可扩展性方面与当前最先进的有界次优 MAPF 算法(如 ECBS、BCP-7 和 eMDD-SAT)相比如何?
- RQ5EECBS 是否能在严格时间限制内扩展至大规模 MAPF 实例(如 1,000 名智能体),同时保持接近最优的解质量?
主要发现
- 在所有六张基准地图上,集成全部四项改进的 EECBS+ 显著优于 ECBS、BCP-7 和 eMDD-SAT,无论在运行时间还是成功率方面。
- 平均而言,EECBS+ 在 1 分钟时限内能处理的智能体数量是 ECBS 的两倍,尤其在 den520d 和 warehouse-10-2-10-2-1 等大型地图上表现突出。
- 在 ECBS 和 EECBS+ 均求解的 1,081 个实例中,EECBS+ 的平均解代价为 1,958,而 ECBS 为 1,967,表明解质量未出现退化。
- 在小地图上且次优性因子较低时,BCP-7 和 eMDD-SAT 表现优于 ECBS,但 EECBS+ 在所有地图尺寸和智能体数量下均超越三者。
- EES 与在线学习的结合使 EECBS 实现了比 ECBS 更快的收敛速度,尤其在启发式函数呈负相关时效果更明显。
- 在 den312d 地图和含 180 名智能体的随机地图上,EECBS+ 几乎求解了所有实例,而 ECBS 在相同时间限制下仅求解了少数或无一。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。