QUICK REVIEW

[논문 리뷰] Olisipo: A Probabilistic Approach to the Adaptable Execution of Deterministic Temporal Plans

Oscar Lima, Michael Cashmore|arXiv (Cornell University)|2020. 03. 20.

AI-based Problem Solving and Planning참고 문헌 17인용 수 4

한 줄 요약

이 논문은 결정론적이고 완전순서가 지정된 계획을 동적으로 재정렬 및 건너뛰기가 가능한 부분순서 계획으로 변환하는 확률적 프레임워크인 Olisipo를 제안한다. 이는 예기치 않은 환경 변화에 대응하기 위해 온라인에서 동작을 재정렬하고 건너뛸 수 있도록 한다. 동적으로 유효한 완전순서 집합과 그에 따른 성공 확률을 계산함으로써, 목표 달성 가능성을 극대화하는 동작을 선택함으로써 재계획 수립과 시뮬레이션에서 실행되는 동작을 줄이며, 특히 시간 제약 조건과 동적 환경 하에서 효과적이다.

ABSTRACT

In order to ensure the robust actuation of a plan, execution must be adaptable to unexpected situations in the world and to exogenous events. This is critical in domains in which committing to a wrong ordering of actions can cause the plan failure, even when all the actions succeed. We propose an approach to the execution of a task plan that permits some adaptability to unexpected observations of the state while maintaining the validity of the plan through online reasoning. Our approach computes an adaptable, partially-ordered plan from a given totally-ordered plan. The partially-ordered plan is adaptable in that it can exploit beneficial differences between the world and what was expected. The approach is general in that it can be used with any task planner that produces either a totally or a partially-ordered plan. We propose a plan execution algorithm that computes online the complete set of valid totally-ordered plans described by an adaptable partially-ordered plan together with the probability of success for each of them. This set is then used to choose the next action to execute.

연구 동기 및 목표

실세계 관측치가 계획 가정과 다를 경우에도 강력한 작업 계획 실행을 해결하기 위해.
동작 지속 시간, 전제 조건 또는 외부 사건의 예기치 않은 변화에 대응하기 위해 온라인 적응을 가능하게 함으로써 고비용 재계획 수립에 대한 의존도를 줄이기 위해.
원래의 인과 제약 조건 위반이 발생하더라도 계획의 유효성과 목표 달성을 유지하기 위해 확률적 온라인 추론을 통해 수행하기 위해.
실시간 관측치에 적응할 수 있는 빠르고 실용적인 동작 선택 정책을 개발하기 위해.

제안 방법

인과 제약 조건을 완화시켜 런타임 유연성을 높임으로써, 초기 완전순서 계획을 적응 가능한 부분순서 계획으로 변환한다.
적응 가능한 부분순서에 의해 유도되는 유효한 완전순서 계획의 전체 집합을 온라인으로 계산한다.
예상 확률(예: 동작 지속 시간, 상태 변화 등)을 기반으로 각 유효한 완전순서에 성공 확률을 할당한다.
목표 달성 가능성을 극대화하는 데 기반해 다음으로 실행할 동작을 선택하는 새로운 동작 선택 정책을 사용한다.
시뮬레이션된 로봇 환경에서 종단 간 실행을 위해 ROSPlan 프레임워크에 이 접근법을 통합한다.
유효한 완전순서가 존재하지 않을 경우에만 동적 재계획 수립 트리거를 사용하여 재계획 수 overhead 를 최소화한다.

실험 결과

연구 질문

RQ1결정론적 계획에서 파생된 부분순서 계획이 전체 재계획 수립 없이도 예기치 않은 관측치에 효과적으로 적응할 수 있는가?
RQ2적응 가능한 부분순서 계획의 모든 유효한 완전순서 집합을 온라인으로 성공 확률과 함께 계산할 수 있는가?
RQ3불확실성 하에서 실행 중일 때 목표 달성 가능성을 극대화하는 데 가장 효과적인 동작 선택 정책은 무엇인가?
RQ4시간 제약 조건과 동적 환경에서 기존의 재계획 수립 방식과 비교해 본다면, 제안된 방법은 재계획 수립 횟수와 실행된 동작 수에서 어떤가?

주요 결과

사전 정의된 마감 시간이 없는 작업에서는 재정렬 접근법(RO)이 평균 0.9회의 재계획 수립으로 98%의 커버리지 달성을 달성했고, 재계획 수립 기반 기준선(RP)은 1.6회였다.
마감 시간이 있는 작업에서는 RO가 91%의 커버리지와 0.7회의 평균 재계획 수립을 기록했고, RP는 97%의 커버리지와 2.9회의 평균 재계획 수립을 기록하여 커버리지 손실는 최소화하면서도 재계획 수립 횟수는 크게 줄였다.
RO는 마감 시간이 없는 작업에서 평균 12.5회의 동작을 실행했고, RP는 13.7회로 전체적으로 실행된 동작 수가 적었다.
알고리즘은 효율적으로 확장되었으며, 최대 128개의 노드를 가진 계획에 대해서도 모든 유효한 순서 생성을 10초 이내에 완료했다.
재계획 수립이 불가능한 사전 조건이 있는 도메인이나 계산 자원이 제한된 환경에서도 시스템이 실용성을 입증했다.
특히 시간 제약 조건과 동적 환경 하에서 재계획 수립 횟수와 총 실행 동작 수를 모두 줄였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.