QUICK REVIEW

[论文解读] Multi-Agent Path Finding with Delay Probabilities

Hang Ma, T. K. Satish Kumar|arXiv (Cornell University)|Dec 15, 2016

Robotic Path Planning Algorithms被引用 28

一句话总结

本文提出了多智能体路径规划延迟概率（MAPF-DP）框架，通过随机延迟建模不完善的计划执行。提出了一种两级求解器——期望近似最小化（AME），以及去中心化的鲁棒执行策略（MCPs 和 FSPs），以生成平均完工时间较短且在不确定性下防止碰撞的计划，在最多 200 个智能体的大规模实例上实现了可扩展性能。

ABSTRACT

Several recently developed Multi-Agent Path Finding (MAPF) solvers scale to large MAPF instances by searching for MAPF plans on 2 levels: The high-level search resolves collisions between agents, and the low-level search plans paths for single agents under the constraints imposed by the high-level search. We make the following contributions to solve the MAPF problem with imperfect plan execution with small average makespans: First, we formalize the MAPF Problem with Delay Probabilities (MAPF-DP), define valid MAPF-DP plans and propose the use of robust plan-execution policies for valid MAPF-DP plans to control how each agent proceeds along its path. Second, we discuss 2 classes of decentralized robust plan-execution policies (called Fully Synchronized Policies and Minimal Communication Policies) that prevent collisions during plan execution for valid MAPF-DP plans. Third, we present a 2-level MAPF-DP solver (called Approximate Minimization in Expectation) that generates valid MAPF-DP plans.

研究动机与目标

形式化多智能体路径规划问题延迟概率（MAPF-DP），以建模由于随机延迟导致的不完善计划执行。
定义有效的 MAPF-DP 计划，并提出鲁棒、去中心化的计划执行策略，以在执行过程中防止碰撞。
开发一种可扩展的两级求解器——期望近似最小化（AME），生成具有小平均完工时间的有效 MAPF-DP 计划。
在不确定性下评估不同计划执行策略（最小通信策略（MCPs）、完全同步策略（FSPs）和非鲁棒虚拟策略）的性能。
证明鲁棒执行策略即使在智能体数量增加时，也能显著减少碰撞，同时保持较低的平均完工时间。

提出的方法

将 MAPF-DP 形式化为一种问题，其中智能体以延迟概率执行移动动作，导致以该概率停留在原地。
将有效的 MAPF-DP 计划定义为一系列等待和移动动作的序列，确保在延迟概率下执行时无碰撞。
提出两类去中心化的鲁棒执行策略：最小通信策略（MCPs）和完全同步策略（FSPs），两者均旨在执行过程中防止顶点和边碰撞。
实现一种两级求解器——期望近似最小化（AME），其结合高层冲突消解与受约束的低层路径规划。
使用信念状态近似来估计期望完工时间，并引导高层搜索朝向期望执行时间较短的计划。
通过 1,000 次蒙特卡洛模拟评估计划执行，测量平均完工时间、碰撞率和通信成本（发送的消息数）。

实验结果

研究问题

RQ1如何将 MAPF 问题扩展以建模具有已知延迟概率的不完善计划执行？
RQ2在随机延迟下，哪些类型的去中心化、鲁棒计划执行策略可以防止 MAPF-DP 中的碰撞？
RQ3像 AME 这样的两级求解器能否生成具有小平均完工时间的有效 MAPF-DP 计划，同时在大规模智能体数量下保持可扩展性？
RQ4不同执行策略（MCPs、FSPs 和非鲁棒虚拟策略）如何影响平均完工时间和碰撞率？
RQ5在不确定性下，鲁棒执行策略的通信成本与性能之间存在何种权衡？

主要发现

AME 在 5 分钟内解决了 94% 的 50 个智能体 MAPF-DP 实例，平均完工时间为 75.19，共发送 474.62 条消息。
对于 100 个智能体，AME 解决了 68% 的实例，平均完工时间为 87.29，共发送 1,554.71 条消息；随着智能体数量增加，性能呈平稳下降趋势。
MCPs 的平均完工时间仅略高于虚拟策略（例如，随机 1 中为 71.28 vs. 71.96），但按设计将碰撞从 16.68 降低至 0。
FSPs 的平均完工时间更高（例如，随机 1 中为 140.29 vs. 71.28），且消息数显著更多（23,109 vs. 267），表明通信成本更高。
在仓库环境中，MCPs 维持了较低的平均完工时间（例如，仓库 1 中为 122.42）和较低的碰撞数（34.59），而 FSPs 的成本更高且完工时间更长。
AME 计算的近似平均完工时间与实际平均完工时间之间的差异合理（例如，随机 1 中约为 6%），表明估计具有良好的准确性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。