QUICK REVIEW

[논문 리뷰] Stable Model-based Control with Gaussian Process Regression for Robot Manipulators

Thomas Beckers, Jonas Umlauft|arXiv (Cornell University)|2019. 09. 18.

Advanced Control Systems Optimization참고 문헌 19인용 수 24

한 줄 요약

이 논문은 비모수적 가우시안 프로세스 회귀(GPR)를 사용하여 로봇 암거를 위한 안정적이고 데이터 기반의 계산된 토크 제어 법칙을 제안한다. GPR을 통해 근사된 로봇 모델과 실제 역학 간의 차이를 학습함으로써, 추적 오차의 확률적 유계성과 훈련 데이터가 증가함에 따라 점점 더 안정성이 향상되는 것을 보장한다. 이 방법은 유연한 암거 작업에서 시뮬레이션 및 실제 실험 모두에서 전통적인 계산된 토크 제어법과 고이득 PD 제어법보다 뛰어난 성능을 보였다.

ABSTRACT

Computed-torque control requires a very precise dynamical model of the robot for compensating the manipulator dynamics. This allows reduction of the controller's feedback gains resulting in disturbance attenuation and other advantages. Finding precise models for manipulators is often difficult with parametric approaches, e.g. in the presence of complex friction or flexible links. Therefore, we propose a novel computed-torque control law which consists of a PD feedback and a dynamic feed forward compensation part with Gaussian Processes. For this purpose, the nonparametric Gaussian Process regression infers the difference between an estimated and the true dynamics. In contrast to other approaches, we can guarantee that the tracking error is stochastically bounded. Furthermore, if the number of training points tends to infinity, the tracking error is asymptotically stable in the large. In simulation and with an experiment, we demonstrate the applicability of the proposed control law and that it outperforms classical computed-torque approaches in terms of tracking precision.

연구 동기 및 목표

복잡한 비선형성(마찰, 유연한 링크 등)이 존재하는 상황에서도 정밀한 동역학 모델링을 해결하기 위해.
정확한 물리적 파라미터가 필요하고 구조적 불확실성 하에서 실패하는 파rametric 모델의 한계를 극복하기 위해.
고이득 피드백에 의존하지 않고도 안정성과 수렴성을 보장하는 데이터 기반 제어 법칙을 개발하기 위해.
비모수적 GPR을 통해 미모델링 동역학을 학습함으로써 안전하고 저이득 제어를 실현하면서도 높은 추적 정밀도를 확보하기 위해.
제한된 훈련 데이터 조건에서도 추적 오차의 확률적 유계성과 점진적 안정성에 대한 이론적 보장을 제공하기 위해.

제안 방법

노멀 모델과 실제 동역학 간의 차이를 모델링하기 위해 궤적 데이터 기반으로 가우시안 프로세스(GP)를 훈련한다.
낮은 이득 PD 피드백과 모델 오차를 보상하는 GPR 기반 동역학 피드포워드 항을 조합한 제어 법칙을 사용한다.
GPR은 초모수를 최적화하기 위해 훈련 데이터 기반의 우도 최대화를 통해 최적화된 제곱 지수 공분산 함수를 사용한다.
직접 관절 가속도 피드백을 피하기 위해 위치 및 속도 피드백만을 사용함으로써, 노이즈가 많고 측정이 어려운 가속도 피드백을 회피한다.
리아푸노프 기반 분석을 통해 추적 오차가 0 주위로 확률적으로 유계임을 증명한다.
훈련 포인트 수가 증가함에 따라 오차 유계가 감소하며, 이는 대규모에서 점차적 안정성으로 이어진다.

실험 결과

연구 질문

RQ1비모수적 GPR 기반 피드포워드 보정이 미모델링 동역학이 존재하는 로봇 암거의 추적 성능을 향상시킬 수 있는가?
RQ2제안된 제어 법칙이 훈련 데이터 크기에 관계없이 추적 오차의 확률적 유계성을 보장하는가?
RQ3비선형성이 존재하는 실제 환경에서 GPR 기반 제어기의 성능이 전통적인 계산된 토크 제어법과 고이득 PD 제어법보다 어떻게 다른가?
RQ4훈련 데이터를 늘일 경우 추적 오차의 수렴성과 정확도에 어떤 영향을 미치는가?
RQ5이 방법은 고이득 피드백 없이도 높은 정밀도 제어를 달성할 수 있는가? 이는 액추에이터 포화와 노이즈 증폭을 방지할 수 있는가?

주요 결과

제안된 CT-GP 제어기는 시뮬레이션과 실험 모두에서 모든 저이득 제어기(LG-PD, CT, CT-SP)보다 낮은 RMSE를 달성했으며, 고이득 PD(HG-PD) 제어기와 경쟁 수준의 성능을 보였다.
실험에서 CT-GP 제어기는 고이득 기반 기준 대비 피드백 이득을 40배 감소시켰지만 유사한 추적 정밀도를 유지했다.
첫 번째 관절의 경우 RMSE는 CT 제어기의 0.15 rad에서 CT-GP 제어기의 0.05 rad로 감소했고, 두 번째 관절의 경우 0.12 rad에서 0.07 rad로 감소하여 뚜렷한 향상을 보였다.
그림 9의 학습 곡선은 훈련 포인트 수를 100에서 400으로 늘일 경우 약 50% 감소한 RMSE를 보여주며 데이터 효율성을 확인했다.
CT-GP의 토크 프로파일은 고이득 제어기(HG-PD)와 매우 유사하여, 높은 피드백 이득 없이도 효과적인 동역학 보정이 이루어졌음을 시사한다.
이론적 분석을 통해 추적 오차가 훈련 데이터가 무한히 증가함에 따라 확률적으로 유계이면서 점차적 안정성이 보장됨을 확인했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.