QUICK REVIEW

[論文レビュー] PDDLStream: Integrating Symbolic Planners and Blackbox Samplers via Optimistic Adaptive Planning

Caelan Reed Garrett, Tomás Lozano‐Pérez|arXiv (Cornell University)|Feb 23, 2018

AI-based Problem Solving and Planning被引用数 26

ひとこと要約

PDDLStreamは、連続的かつ高次元の計画問題に対して、記号的PDDLプランナとブラックボックス型のサンプリング手順を統合するフレームワークを導入する。ストリームを用いてサンプリング手順を記述的に指定し、探索と活用のバランスを取る適応的アルゴリズムを採用することで、複雑なロボットのタスクおよびモーション計画問題を効率的に解き、制約付きおよびコスト感受性の高いタスクにおいて先行手法を上回る性能を発揮する。

ABSTRACT

Many planning applications involve complex relationships defined on high-dimensional, continuous variables. For example, robotic manipulation requires planning with kinematic, collision, visibility, and motion constraints involving robot configurations, object poses, and robot trajectories. These constraints typically require specialized procedures to sample satisfying values. We extend PDDL to support a generic, declarative specification for these procedures that treats their implementation as black boxes. We provide domain-independent algorithms that reduce PDDLStream problems to a sequence of finite PDDL problems. We also introduce an algorithm that dynamically balances exploring new candidate plans and exploiting existing ones. This enables the algorithm to greedily search the space of parameter bindings to more quickly solve tightly-constrained problems as well as locally optimize to produce low-cost solutions. We evaluate our algorithms on three simulated robotic planning domains as well as several real-world robotic tasks.

研究の動機と目的

ロボット操作における運動学的制約、衝突、視認性などの複雑な制約を伴う連続的かつ高次元の計画空間における計画の課題に対処すること。
離散化や有限な行動空間を必要とする既存のPDDL拡張の限界を克服し、現実のロボットドメインへの適用可能性を制限する要因を排除すること。
記述的ストリームを介して、連続的行動パラメータのドメインに依存しないモジュラーな指定を可能にし、ブラックボックス型のサンプリング手順をカプセル化すること。
探索（新しい計画の検索）と活用（既存の計画のパラメータバインディングのサンプリング）の動的バランスを取るアルゴリズムを開発し、効率性と解の質を向上させること。
シミュレーションおよび現実世界のロボット計画タスク、特に操作およびキッチンタスクにおいて、フレームワークの有効性を実証すること。

提案手法

入力を基に値のシーケンスを生成する条件付きジェネレータ（ストリーム）を導入し、PDDLを拡張することで、それらの値が満たすべき制約を記述的に指定する。
連続的行動パラメータ（例：ロボットの配置、軌道）をストリームの出力としてモデル化し、その実装をブラックボックスとして扱う。
Incremental、Focused、Binding、および新規のAdaptiveアルゴリズムを用いて、PDDLStream問題を有限PDDL問題の系列に還元する。
探索（新しい楽観的計画の探索）と活用（既存の計画のパラメータバインディングのサンプリング）のバランスを取るために、Adaptiveアルゴリズムを実装する。
固定オブジェクトを自由パラメータに再バインドすることで、連続値のより包括的な組み合わせを探索する楽観的計画戦略を採用する。
FastDownwardなどの既成品のPDDLプランナをサブルーチンとして統合し、PyBulletを用いてロボットシミュレーションおよび現実世界の実行におけるストリーム評価を実施する。

実験結果

リサーチクエスチョン

RQ1記号的PDDLプランナとブラックボックス型サンプリング手順を、連続的かつ高次元の計画ドメインでどのように効果的に統合できるか？
RQ2探索と活用の適応的バランスは、きびしい制約やコスト感受性の高い問題において、計画の効率性をどの程度向上させ得るか？
RQ3ドメインに依存しない記述的フレームワークは、連続変数の事前離散化を必要とせずに、複雑なロボット操作タスクをサポートできるか？
RQ4制約付き計画問題において、提案されたAdaptiveアルゴリズムの性能は、成功確率、解のコスト、実行時間の観点から、既存のアルゴリズムと比較してどの程度優れているか？
RQ5PDDLStreamは、多様な行動と複雑な制約を伴う現実世界のロボットのタスクおよびモーション計画を可能にするか？

主な発見

ドメイン1の制約付き問題において、AdaptiveアルゴリズムはIncremental、Focused、Bindingアルゴリズムを著しく上回り、ブロック数が3から5に増加するに従い、より高い成功確率を達成した。
ドメイン2では、FocusedおよびBindingよりもAdaptiveがより速く低コストの解に収束し、時間の経過とともに平均計画コストがより速く低下し、0.5標準偏差の信頼区間から一貫した性能が示された。
幾何的制約が少ないドメイン3では、すべてのアルゴリズム（Focused、Binding、Adaptive）が類似した性能を示し、Incrementalを上回った。Adaptiveは追加のストリームバインディング計算によるわずかな実行時間の増加を示したが、差は僅かであった。
現実世界のロボットタスク、特に食事提供、調理、操作タスクにおいて、PR2ロボットを用いて衝突のない実行可能な計画がPDDLStreamによって正常に生成され、動画で成功した実行が確認された。
フレームワークにより、連続的パラメータをストリームを介して探索可能とすることで、無限に多くの行動インスタンスを含むドメインにおいても効率的な計画が可能となり、ポーズや配置の人的な事前離散化の必要がなくなった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。