Skip to main content
QUICK REVIEW

[论文解读] Multi-Agent Path Finding with Delay Probabilities

Hang Ma, T. K. Satish Kumar|arXiv (Cornell University)|Dec 15, 2016
Robotic Path Planning Algorithms被引用 28
一句话总结

本文提出了多智能体路径规划延迟概率(MAPF-DP)框架,通过随机延迟建模不完善的计划执行。提出了一种两级求解器——期望近似最小化(AME),以及去中心化的鲁棒执行策略(MCPs 和 FSPs),以生成平均完工时间较短且在不确定性下防止碰撞的计划,在最多 200 个智能体的大规模实例上实现了可扩展性能。

ABSTRACT

Several recently developed Multi-Agent Path Finding (MAPF) solvers scale to large MAPF instances by searching for MAPF plans on 2 levels: The high-level search resolves collisions between agents, and the low-level search plans paths for single agents under the constraints imposed by the high-level search. We make the following contributions to solve the MAPF problem with imperfect plan execution with small average makespans: First, we formalize the MAPF Problem with Delay Probabilities (MAPF-DP), define valid MAPF-DP plans and propose the use of robust plan-execution policies for valid MAPF-DP plans to control how each agent proceeds along its path. Second, we discuss 2 classes of decentralized robust plan-execution policies (called Fully Synchronized Policies and Minimal Communication Policies) that prevent collisions during plan execution for valid MAPF-DP plans. Third, we present a 2-level MAPF-DP solver (called Approximate Minimization in Expectation) that generates valid MAPF-DP plans.

研究动机与目标

  • 形式化多智能体路径规划问题延迟概率(MAPF-DP),以建模由于随机延迟导致的不完善计划执行。
  • 定义有效的 MAPF-DP 计划,并提出鲁棒、去中心化的计划执行策略,以在执行过程中防止碰撞。
  • 开发一种可扩展的两级求解器——期望近似最小化(AME),生成具有小平均完工时间的有效 MAPF-DP 计划。
  • 在不确定性下评估不同计划执行策略(最小通信策略(MCPs)、完全同步策略(FSPs)和非鲁棒虚拟策略)的性能。
  • 证明鲁棒执行策略即使在智能体数量增加时,也能显著减少碰撞,同时保持较低的平均完工时间。

提出的方法

  • 将 MAPF-DP 形式化为一种问题,其中智能体以延迟概率执行移动动作,导致以该概率停留在原地。
  • 将有效的 MAPF-DP 计划定义为一系列等待和移动动作的序列,确保在延迟概率下执行时无碰撞。
  • 提出两类去中心化的鲁棒执行策略:最小通信策略(MCPs)和完全同步策略(FSPs),两者均旨在执行过程中防止顶点和边碰撞。
  • 实现一种两级求解器——期望近似最小化(AME),其结合高层冲突消解与受约束的低层路径规划。
  • 使用信念状态近似来估计期望完工时间,并引导高层搜索朝向期望执行时间较短的计划。
  • 通过 1,000 次蒙特卡洛模拟评估计划执行,测量平均完工时间、碰撞率和通信成本(发送的消息数)。

实验结果

研究问题

  • RQ1如何将 MAPF 问题扩展以建模具有已知延迟概率的不完善计划执行?
  • RQ2在随机延迟下,哪些类型的去中心化、鲁棒计划执行策略可以防止 MAPF-DP 中的碰撞?
  • RQ3像 AME 这样的两级求解器能否生成具有小平均完工时间的有效 MAPF-DP 计划,同时在大规模智能体数量下保持可扩展性?
  • RQ4不同执行策略(MCPs、FSPs 和非鲁棒虚拟策略)如何影响平均完工时间和碰撞率?
  • RQ5在不确定性下,鲁棒执行策略的通信成本与性能之间存在何种权衡?

主要发现

  • AME 在 5 分钟内解决了 94% 的 50 个智能体 MAPF-DP 实例,平均完工时间为 75.19,共发送 474.62 条消息。
  • 对于 100 个智能体,AME 解决了 68% 的实例,平均完工时间为 87.29,共发送 1,554.71 条消息;随着智能体数量增加,性能呈平稳下降趋势。
  • MCPs 的平均完工时间仅略高于虚拟策略(例如,随机 1 中为 71.28 vs. 71.96),但按设计将碰撞从 16.68 降低至 0。
  • FSPs 的平均完工时间更高(例如,随机 1 中为 140.29 vs. 71.28),且消息数显著更多(23,109 vs. 267),表明通信成本更高。
  • 在仓库环境中,MCPs 维持了较低的平均完工时间(例如,仓库 1 中为 122.42)和较低的碰撞数(34.59),而 FSPs 的成本更高且完工时间更长。
  • AME 计算的近似平均完工时间与实际平均完工时间之间的差异合理(例如,随机 1 中约为 6%),表明估计具有良好的准确性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。