Skip to main content
QUICK REVIEW

[논문 리뷰] Probabilistic Safety Constraints for Learned High Relative Degree System Dynamics

Mohammad Javad Khojasteh, Vikas Dhiman|arXiv (Cornell University)|2019. 12. 20.
Fault Detection and Control Systems참고 문헌 41인용 수 26
한 줄 요약

이 논문은 고상대차수 시스템 동역학의 온라인 학습을 위해 가우시안 프로세스 회귀를 사용하는 확률적 안전성 프레임워크를 제안한다. 비드라이프 및 입력 이득 항에 대한 불확실성 모델링을 통해 제어 바리어 함수를 이용한 확률적 제약 조건을 설정함으로써, 고상대차수의 복잡한 비완전제어 시스템에 대해 높은 확률로 안전성을 보장하는 자가촉도 제어를 가능하게 한다.

ABSTRACT

This paper focuses on learning a model of system dynamics online while satisfying safety constraints.Our motivation is to avoid offline system identification or hand-specified dynamics models and allowa system to safely and autonomously estimate and adapt its own model during online operation.Given streaming observations of the system state, we use Bayesian learning to obtain a distributionover the system dynamics. In turn, the distribution is used to optimize the system behavior andensure safety with high probability, by specifying a chance constraint over a control barrier function.

연구 동기 및 목표

  • 사전에 특정화된 또는 수작업으로 지정된 동역학 모델에 의존하지 않고 자율적인 온라인 시스템 식별을 가능하게 하기 위해.
  • 시스템 동역학의 불확실성을 통합함으로써 온라인 학습 중 안전성을 보장하기 위해.
  • 모델이 알려지지 않은 동역학을 갖는 시스템과 임의의 상대차수를 갖는 시스템으로 제어 바리어 함수(CBF) 이론을 확장하기 위해.
  • 제어 갱신 빈도를 최소화하면서도 높은 확률로 안전성을 유지하는 자가촉도 제어 정책을 유도하기 위해.
  • 효율적인 공분산 분해를 사용하는 매트릭스 변수 GP 회귀를 통한 확장 가능한 확률적 안전 제약 조건 제공하기 위해.

제안 방법

  • 제어-아핀 시스템에서 드리프트 항 $f(\mathbf{x})$와 입력 이득 $g(\mathbf{x})$를 동시에 모델링하기 위해 매트릭스 변수 가우시안 프로세스 회귀를 사용한다.
  • 제어 바리어 함수의 리에 도함수를 활용하여 시스템 동역학의 평균과 분산을 기반으로 한 안전 조건을 표현한다.
  • GP 회귀의 사후 분포를 활용하여 CBF 조건에 대해 확률적 제약 조건을 강제함으로써 확률적 안전 제약 조건을 유도한다.
  • 안전성을 고려한 최대 간격 동안 제어 갱신이 필요 없는 자가촉도 제어 메커니즘을 도입한다.
  • 고차원 시스템으로의 확장성을 높이고 계산 비용을 줄이기 위해 GP 내에서 효율적인 공분산 분해를 적용한다.
  • 제어 바리어 함수의 리에 도함수의 평균과 분산만을 기반으로 한 안전 조건을 표현함으로써, 임의의 상대차수 시스템으로 프레임워크를 확장한다.

실험 결과

연구 질문

  • RQ1진정한 동역학이 알려져 있지 않고 변화하는 상황에서 온라인으로 시스템 동역학을 학습할 때 어떻게 안전성을 확보할 수 있는가?
  • RQ2고상대차수 시스템에서의 불확실성을 고려한 적절한 제어 바리어 함수의 확률적 공식화는 무엇인가?
  • RQ3제어 빈도를 최소화하면서도 높은 확률로 안전성을 유지할 수 있는 자가촉도 제어 정책을 유도할 수 있는가?
  • RQ4매트릭스 변수 GP 회귀를 어떻게 활용하여 드리프트 및 입력 이득 항을 불확실성과 함께 효율적으로 모델링할 수 있는가?
  • RQ5임의의 상대차수를 갖는 시스템에서 안전성을 확보하기 위해 필요한 최소한의 정보(리에 도함수의 평균과 분산)는 무엇인가?

주요 결과

  • 제안된 방법은 베이지안 GP 회귀를 사용하여 확률적 안전성 보장을 갖는 안전한 온라인 시스템 동역학 학습을 가능하게 한다.
  • 이 프레임워크는 상대차수 1에 국한되지 않고, 알려지지 않은 동역학과 임의의 상대차수를 갖는 시스템으로 제어 바리어 함수 이론을 성공적으로 확장한다.
  • 사후 불확실성 기반으로 최대 안전 간격을 계산하는 자가촉도 제어 정책이 도출된다.
  • 리에 도함수의 평균과 분산만을 사용하는 방식으로 안전 조건을 표현함으로써 확장 가능한 안전성 검증을 달성한다.
  • 실험 결과는 모델 불확실성 하에서도 높은 확률로 안전성을 유지함을 보여주며, 불확실한 환경에서 결정론적 CBF 접근법보다 뛰어난 성능을 발휘한다.
  • 공분산 분해를 적용한 매트릭스 변수 GP의 사용은 효율적인 계산을 가능하게 하여 고차원 시스템에 적용 가능한 방법을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.