[论文解读] EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration
提出了 H-AIM,一個三階段管道,將 LLM、PDDL 計劃與行為樹結合,用於動態、異質多機器人協作,並在 MACE-THOR 基準上對強基線顯著提升進行驗證。
In embodied artificial intelligence, enabling heterogeneous robot teams to execute long-horizon tasks from high-level instructions remains a critical challenge. While large language models (LLMs) show promise in instruction parsing and preliminary planning, they exhibit limitations in long-term reasoning and dynamic multi-robot coordination. We propose EmboTeam, a novel embodied multi-robot task planning framework that addresses these issues through a three-stage cascaded architecture: 1) It leverages an LLM to parse instructions and generate Planning Domain Definition Language (PDDL) problem descriptions, thereby transforming commands into formal planning problems; 2) It combines the semantic reasoning of LLMs with the search capabilities of a classical planner to produce optimized action sequences; 3) It compiles the resulting plan into behavior trees for reactive control. The framework supports dynamically sized heterogeneous robot teams via a shared blackboard mechanism for communication and state synchronization. To validate our approach, we introduce the MACE-THOR benchmark dataset, comprising 42 complex tasks across 8 distinct household layouts. Experiments show EmboTeam improves the task success rate from 12% to 55% and goal condition recall from 32% to 72% over the LaMMA-P baseline.
研究动机与目标
- 從高層自然語言指令出發,解決長期視野、異質多機器人任務規劃。
- 將語義化的 LLM 推理與正式的 PDDL 計劃與反應式行為樹整合,以實現魯棒執行。
- 通過共享黑板通訊機制,使動態、可擴展的機器人團隊成為可能。
- 提供一個新的基準(MACE-THOR),用於在模擬環境中評估複雜家居任務。
提出的方法
- 三階段串聯架構:PDDL File Generator (PFG) 通過 LLM 基於語義解析與協同優化的任務分解與分配,將指令轉換為 PDDL 計劃問題。
- Hybrid Planner (HP) 結合 LLM 助力的語義驗證與傳統規劃器(FastDownward),生成子計劃並使用基於 LLM 的協調將它們合併為全球一致的計劃。
- Behavior Tree Compiler (BTC) 將全球計劃轉換為包含前置條件檢查、回退與多機協同反應控制的並行行為樹,通過共享黑板實現反應式多機控制。
实验结果
研究问题
- RQ1如何將 LLM 與正式的 PDDL 計劃結合,以處理長期視野的異質多機任務?
- RQ2三階段管道(PFG、HP、BTC)是否能在動態環境中提供魯棒、容錯的執行?
- RQ3共享黑板通訊機制是否提升動態大小機器人團隊的同步與協調?
- RQ4與強基線相比,在具有挑戰性的多機器人基準上,在哪些方面的成功率與目標回憶率得到提升?
主要发现
- 在 MACE-THOR 基準上,H-AIM 相比最強基線(LaMMA-P)顯著提高任務成功率與目標條件回憶率,且使用更高能力的 LLM(如 GPT-4o)時性能顯著上升。
- PFG 能夠實現理性的任務分解與技能分配,最大化平行性與原子任務執行,同時確保與機器人能力的兼容性。
- HP 透過語義推理合併子計劃以解決時間與資源衝突,產生全球一致的計劃。
- BTC 通過前置條件、恢復/重試、核心行動執行與後驗證提供魯棒執行,將線性計劃轉換為容錯的行為樹。
- 共享黑板機制對於時間依賴任務與動態環境中的同步與避免碰撞至關重要。
- 通過消融研究顯示,移除 PFG 或 HP 會破壞規劃;移除 BTC 會降低執行可靠性;完全整合則達到最佳表現。
- MACE-THOR 數據集包含 42 個任務,跨 8 個環境,分為並行-獨立與時間依賴任務,便於評估分解、分配與協作。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。