QUICK REVIEW

[論文レビュー] Olisipo: A Probabilistic Approach to the Adaptable Execution of Deterministic Temporal Plans

Oscar Lima, Michael Cashmore|arXiv (Cornell University)|Mar 20, 2020

AI-based Problem Solving and Planning参考文献 17被引用数 4

ひとこと要約

本稿では、決定論的かつ完全順序付けされた計画を、オンラインでの再順序付けやアクションのスキップを可能にする適応可能な部分順序計画に変換する確率的フレームワーク、Olisipoを提案する。動的に有効な全順序付けの集合とその成功確率を計算することで、目標達成の確率を最大化するアクションを選択し、再計画の回数とシミュレーションで実行されるアクションを削減する。特に時間的制約や動的環境下でも有効である。

ABSTRACT

In order to ensure the robust actuation of a plan, execution must be adaptable to unexpected situations in the world and to exogenous events. This is critical in domains in which committing to a wrong ordering of actions can cause the plan failure, even when all the actions succeed. We propose an approach to the execution of a task plan that permits some adaptability to unexpected observations of the state while maintaining the validity of the plan through online reasoning. Our approach computes an adaptable, partially-ordered plan from a given totally-ordered plan. The partially-ordered plan is adaptable in that it can exploit beneficial differences between the world and what was expected. The approach is general in that it can be used with any task planner that produces either a totally or a partially-ordered plan. We propose a plan execution algorithm that computes online the complete set of valid totally-ordered plans described by an adaptable partially-ordered plan together with the probability of success for each of them. This set is then used to choose the next action to execute.

研究の動機と目的

現実世界の観測が計画の仮定と異なる場合の、ロバストなタスク計画実行の課題に対処すること。
アクションの実行時間、事前条件、外部要因の変化に対する予期しない変化にオンラインで適応可能にすることで、高コストな再計画への依存を減らすこと。
元の因果的制約が破られた場合でも、確率的オンライン推論により計画の有効性と目標達成を維持すること。
オンラインで動作し、リアルタイムの観測に適応可能な、高速で実用的なアクション選択方策を開発すること。

提案手法

因果的制約を緩和することで、初期の完全順序計画を、実行時における柔軟性を高めた適応可能な部分順序計画に変換する。
オンラインで、適応可能な部分順序によって誘導されるすべての有効な全順序計画の集合を計算する。
計画変数（例：アクションの実行時間、状態変化）の推定確率に基づき、各有効な全順序に成功確率を割り当てる。
目標達成の全体的な確率を最大化するように次に実行するアクションを選択する、新しいアクション選択方策を用いる。
シミュレーテッドロボット環境におけるエンドツーエンド実行を可能にするために、ROSPlanフレームワークにアプローチを統合する。
有効な全順序が存在しない場合にのみ動的再計画のトリガーを発動させることで、再計画のオーバーヘッドを最小限に抑える。

実験結果

リサーチクエスチョン

RQ1決定論的計画から導出された部分順序計画は、完全な再計画を必要とせずに、予期しない観測への適応を効果的に行えるか？
RQ2適応可能な部分順序計画のすべての有効な全順序付けの集合を、関連する成功確率とともにオンラインでどのように計算できるか？
RQ3不確実性下での実行中に、目標達成の確率を最大化するアクション選択方策は何か？
RQ4時間的制約や動的環境下において、従来の再計画手法と比較して、提案手法は再計画の回数と実行アクション数の両面でどのように異なるか？

主な発見

デッドラインのないタスクでは、再順序付け手法（RO）は1タスクあたり平均0.9回の再計画で98％のカバレッジを達成したのに対し、再計画ベースライン（RP）は1.6回であった。
デッドラインのあるタスクでは、ROは0.7回の平均再計画で91％のカバレッジを達成したのに対し、RPは2.9回の平均再計画で97％のカバレッジを達成した。再計画の大幅な削減と比較的低いカバレッジ損失を実現した。
ROはデッドラインのないタスクで平均12.5のアクションを実行したのに対し、RPは13.7であった。全体的な実行アクション数が減少したことを示している。
アルゴリズムは効率的にスケーリングされ、最大128ノードの計画に対しても、すべての有効な順序生成を10秒未塔で完了した。
再計画が非現実的となる、デッドエンドや計算リソースが限られたドメインでも、本システムは実用性を示した。
特に時間的制約や動的環境下では、再計画の発生回数と実行アクション総数の両方を削減した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。