QUICK REVIEW

[논문 리뷰] Safe Nonlinear Control Using Robust Neural Lyapunov-Barrier Functions

Charles Dawson, Zengyi Qin|arXiv (Cornell University)|2021. 09. 14.

Advanced Control Systems Optimization참고 문헌 41인용 수 27

한 줄 요약

이 논문은 학습 기반 프레임워크를 제시하여 안전성과 안정성 보장을 갖춘 강인한 비선형 제어기를 합성하고, 모델 불확실성에 대한 강인성을 갖는 rCLBFs로 실시간 QP 기반 제어를 가능하게 한다. 시뮬레이션에서 다양한 안전 제어 과제에서 강인하게 robust MPC와 비교하여 우수한 성능을 보인다.

ABSTRACT

Safety and stability are common requirements for robotic control systems; however, designing safe, stable controllers remains difficult for nonlinear and uncertain models. We develop a model-based learning approach to synthesize robust feedback controllers with safety and stability guarantees. We take inspiration from robust convex optimization and Lyapunov theory to define robust control Lyapunov barrier functions that generalize despite model uncertainty. We demonstrate our approach in simulation on problems including car trajectory tracking, nonlinear control with obstacle avoidance, satellite rendezvous with safety constraints, and flight control with a learned ground effect model. Simulation results show that our approach yields controllers that match or exceed the capabilities of robust MPC while reducing computational costs by an order of magnitude.

연구 동기 및 목표

모델 불확실성 하에서 비선형 시스템에 대해 안전하고 안정적인 제어기를 합성하기 위한 프레임워크를 개발한다.
제어 Lyapunov-장벽 함수 이론을 강인한(불확실성 인식) 설정(rCLBF)으로 확장한다.
신경망을 이용한 모델 기반 학습을 통해 강인한 인증서 및 제어기를 학습한다.
안전에 민감한 작업을 위한 계산 효율적이고 인증서 기반의 대안을 robust MPC로 제공한다.

제안 방법

경계가 있는 매개변수 불확실성에 CLBF를 확장한 강인 CLBF(rCLBF)를 정의하고 rCLBF-기반 QP 제어기(rCLBF-QP)를 도출한다.
다이나믹스를 θ를 포함한 convex hull Θ에서 제어-선형(control-affine)으로 표현하고 θ 전역에 걸쳐 강인한 감소 조건을 강제한다.
V를 매개변수화하고 신경망 증명 컨트롤러 π_NN를 도입하며, CLBF 조건과 rCLBF-QP의 가능성을 보장하는 손실함수로 오프라인 학습한다.
Lie 도함수에서 유도된 제약으로 작은 QP를 풀어 온라인에서 안전한 제어를 계산한다.
학습에서 V(x)=w(x)^T w(x)를 사용하여 비부정성을 보장하고, 강인 감소 항을 위한 V의 시간 도함수를 추정하는 데 π_NN에 의존한다.
학습된 V를 신경망 검증 도구나 샘플링으로 검증하고, 거의 Lyapunov 이론(Almost Lyapunov) 고려를 통해 희소한 위반 영역을 인정한다.

실험 결과

연구 질문

RQ1경계가 있는 모델 불확실성 하에서 비볼록(nonconvex), 비선형 시스템에 대해 단일한 인증서(rCLBF)가 안전성과 안정성을 보장할 수 있는가?
RQ2모델 기반 학습된 rCLBF가 robust MPC에 비견되는 실시간의 강인한 안전 보장을 제공하면서 계산을 줄일 수 있는가?
RQ3rCLBF-QP 제어기가 장애물 회피, 비선형 지상 효과, 비볼록 안전 제약 등 다양한 과제에서 어떻게 성능을 발휘하는가?
RQ4온라인 컨트롤러의 가능성과 강인성을 보장하는 신경 인증서의 역할은 무엇인가?

주요 결과

과제	알고리즘	안전성 비율	\|\|x_goal\|\|	평가 시간 (ms)
Car trajectory tracking 1	rCLBF-QP	0.7523	10.4
Kinematic model	Robust MPC ( dt=0.1 s, N=6 )	1.5148	194.6
(n=5,ℓ=2,ns=2)	Robust MPC ( dt=0.25 s, N=6 )	12.4438	172.8
Car trajectory tracking 1	rCLBF-QP	1.0340	9.6
Sideslip model	Robust MPC ( dt=0.1 s, N=5 )	0.1560	336.5
(n=7,ℓ=2,ns=2)	Robust MPC ( dt=0.25 s, N=5 )	18.1939	316.9
3D Quadrotor	rCLBF-QP	100%	0.4647	9.7
(n=9,ℓ=4,ns=2)	Robust MPC ( dt=0.10 s, N=5 )	100%	0.0980	316.2
	Robust MPC ( dt=0.25 s, N=5 )	100%	63.6303	291.0
Neural Lander	rCLBF-QP	100%	0.1332	13.1
(n=6,ℓ=3,ns=1)	Robust MPC ( dt=0.10 s, N=5 )	100%	0.2086	247.2
	Robust MPC ( dt=0.25 s, N=5 )	100%	0.3267	253.2
Segway	rCLBF-QP	100%	0.0447	4.4
(n=4,ℓ=1,ns=4)	Robust MPC ( dt=0.10 s, N=5 )	21%	1.3977	214.8
	Robust MPC ( dt=0.25 s, N=5 )	11%	1.9725	239.1
2D Quadrotor 2	rCLBF-QP	83%	18.6	4.4
(n=6,ℓ=2,ns=4)	Robust MPC ( dt=0.10 s, N=5 )	53%	276.9
	Robust MPC ( dt=0.25 s, N=5 )	0%	265.2
Satellite Rendezvous	rCLBF-QP	100%	0.1369	8.2
(n=4,ℓ=2)	Robust MPC ( dt=0.10 s, N=5 )	39%	6.3751	187.3
	Robust MPC ( dt=0.25 s, N=5 )	15%	9.0592	197.4

rCLBF 기반 제어기가 매개변수 불확실성 하에서 다양한 벤치마크에서 안전성과 안정성 보장을 달성한다.
rCLBF-QP 제어기는 노트북 하드웨어에서 실시간으로 실행되며(≈10 ms), robust MPC 대비 계산 속도에서 상당한 개선을 제공한다(대개 한 차례의 크기로).
여러 과제에서 비선형 동역학(예: 지상 효과)이 두드러질 때 특히 rCLBF-QP가 robust MPC의 성능에 근접하거나 이를 상회한다.
Robust MPC의 성능은 제어 주기와 민감하게 연관되며 비선형 모델 또는 비볼록 제약 조건의 안정화에 실패할 수 있는 반면, rCLBF-QP는 안전성과 합리적 추적을 유지한다.
벤치마크 전반에 걸쳐 안전 비율이 보고된 곳에서 최대 100%에 도달하며 robust MPC에 비해 평가 시간이 크게 짧다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.