Skip to main content
QUICK REVIEW

[論文レビュー] DUPLEX: Agentic Dual-System Planning via LLM-Driven Information Extraction

Keru Hua, Ding Wang|arXiv (Cornell University)|Mar 25, 2026
AI-based Problem Solving and Planning被引用数 0
ひとこと要約

DUPLEXはLLMsをスキーマに導かれた情報抽出に限定し、プランナーを用いたPDDLへの決定論的マッピングを行い、失敗を修復する遅いリフレクティブ・システムを備えて長期的な計画の高い信頼性を実現します。

ABSTRACT

While Large Language Models (LLMs) provide semantic flexibility for robotic task planning, their susceptibility to hallucination and logical inconsistency limits their reliability in long-horizon domains. To bridge the gap between unstructured environments and rigorous plan synthesis, we propose DUPLEX, an agentic dual-system neuro-symbolic architecture that strictly confines the LLM to schema-guided information extraction rather than end-to-end planning or code generation. In our framework, a feed-forward Fast System utilizes a lightweight LLM to extract entities, relations etc. from natural language, deterministically mapping them into a Planning Domain Definition Language (PDDL) problem file for a classical symbolic planner. To resolve complex or underspecified scenarios, a Slow System is activated exclusively upon planning failure, leveraging solver diagnostics to drive a high-capacity LLM in iterative reflection and repair. Extensive evaluations across 12 classical and household planning domains demonstrate that DUPLEX significantly outperforms existing end-to-end and hybrid LLM baselines in both success rate and reliability. These results confirm that The key is not to make the LLM plan better, but to restrict the LLM to the part it is good at - structured semantic grounding - and leave logical plan synthesis to a symbolic planner.

研究の動機と目的

  • embodied agents under strict physical constraints. コントラストを抱えつつ現実世界の未構造観測を厳密な象徴計画と結びつける。
  • schema-guided information extraction を介して情報抽出と計画合成を分離し、LLMの負担を軽減する。
  • クラシックIPC領域と具象的な家庭タスクのタスク間で信頼性と効率を向上させる。
  • The objective continues with the same content translated into Japanese may require rephrasing to maintain nuance.

提案手法

  • LLMはPDDL由来のドメインスキーマに導かれた情報抽出子として厳密に機能する。
  • 抽出情報から標準的なPDDLテンプレートを埋めて問題PDDLを形成する決定論的マッパー。
  • 古典的な象徴プランナー(例:Fast Downward)がDomainとProblem PDDLから実行可能な計画を計算する。
  • 計画が失敗した場合、High-capacityなLLMを用いたSlow Systemがプランナー診断を分析してPDDLを繰り返し修復し成功を得る。
  • 三層の検証: (1) Fast Systemでのルールベースチェック, (2) Slow Systemによる意味的検証/訂正, (3) 暗黙の状態修復のためのプランナー診断のリフレクション。
  • 評価は12のIPC/クラシックおよび具象的家庭タスク領域でLLM-as-PlannerおよびLLM+Pと比較する。
Figure 1: Overview of DUPLEX architecture. Fast System : Unstructured inputs are parsed by a lightweight LLM acting solely as an information extractor. The resulting structured data are deterministically mapped to a problem PDDL file, which is then paired with a domain PDDL file and solved by a symb
Figure 1: Overview of DUPLEX architecture. Fast System : Unstructured inputs are parsed by a lightweight LLM acting solely as an information extractor. The resulting structured data are deterministically mapped to a problem PDDL file, which is then paired with a domain PDDL file and solved by a symb

実験結果

リサーチクエスチョン

  • RQ1長期的なタスクに対して、 symbolic plannerと組み合わせたLLMベースの情報抽出器はエンドツーエンドのLLMプランナーより高い信頼性を達成できるか。
  • RQ2Slow Systemがプランナー診断で起動時の誤りを修正・ groundingを改善する効果はどれほどか。
  • RQ3提案する二重システムアーキテクチャはクラシックIPC領域と具象的家庭タスクでどう機能するか。
  • RQ4情報抽出にLLMの役割を限定することが効率性と堅牢性に与える影響は。

主な発見

DomainLLM-as-PlannerLLM+PDUPLEX Fast SystemDUPLEX Full System
Barman0.0100.0100.0100.0
Blocksworld30.090.0100.0100.0
Floortile0.015.030.085.0
Grippers50.0100.0100.0100.0
Storage0.085.0100.0100.0
Termes0.090.0100.0100.0
Tyreworld15.090.0100.0100.0
Visitall0.05.040.095.0
Average11.971.983.897.5
PC Assembly70.076.076.796.7
Dining Setup38.74.070.098.0
Cleaning0.00.030.770.7
Office0.00.026.068.7
Average27.220.050.983.5
  • DUPLEXはIPC領域で平均成功率97.5%を達成し、LLM+P(71.9%)およびLLM-as-Planner(11.9%)を上回る。
  • IPC領域ではSlow Systemを導入するとFloortileとVisitallで大幅な改善を示す(例: Floortile 30.0%から85.0%、Visitall 40.0%から95.0%)。
  • 具象的家庭タスクではDUPLEXは平均成功率83.5%に達し、LLM-as-Planner(27.2%)とLLM+P(20.0%)を上回る。
  • アブレーションはFast System単独でIPC83.8%、家庭成功率50.9%を示し、Slow Systemを追加するとIPC97.5%、家庭83.5%に上昇する。
  • Slow Systemはプランナー診断を活用したPDDL修復を通じて、 groundingエラー、欠落した事実、暗黙状態の欠落からの堅牢な回復を可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。