Skip to main content
QUICK REVIEW

[논문 리뷰] System Identification under Constraints and Disturbance: A Bayesian Estimation Approach

Sergi Martínez, Steve Tonneau|arXiv (Cornell University)|2026. 02. 18.
Robot Manipulation and Learning인용 수 0
한 줄 요약

논문은 에너지 기반 관측값과 등식 제약 리카티(Riccati) 해를 활용하여 확장형 베이스 로봇의 상태 궤적, 교란 및 물리 파라미터를 접촉 및 루프 제약 하에서 공동으로 추정하는 베이지안 시스템 식별 프레임워크를 제시한다. Unitree B1에 Z1 팔을 사용한 하드웨어 실험과 MPC 기반 평가가 베이스라인 대비 정확도와 접촉 일관성을 향상시켰다.

ABSTRACT

We introduce a Bayesian system identification (SysID) framework for jointly estimating robot's state trajectories and physical parameters with high accuracy. It embeds physically consistent inverse dynamics, contact and loop-closure constraints, and fully featured joint friction models as hard, stage-wise equality constraints. It relies on energy-based regressors to enhance parameter observability, supports both equality and inequality priors on inertial and actuation parameters, enforces dynamically consistent disturbance projections, and augments proprioceptive measurements with energy observations to disambiguate nonlinear friction effects. To ensure scalability, we derive a parameterized equality-constrained Riccati recursion that preserves the banded structure of the problem, achieving linear complexity in the time horizon, and develop computationally efficient derivatives. Simulation studies on representative robotic systems, together with hardware experiments on a Unitree B1 equipped with a Z1 arm, demonstrate faster convergence, lower inertial and friction estimation errors, and improved contact consistency compared to forward-dynamics and decoupled identification baselines. When deployed within model predictive control frameworks, the resulting models yield measurable improvements in tracking performance during locomotion over challenging environments.

연구 동기 및 목표

  • 접촉 및 루프 제약 하에서 확장형 베이스 로봇의 상태 궤적, 교란, 작용기 효과 및 물리 파라미터를 공동으로 추정한다.
  • 물리적으로 일관된 역학, 접촉 제약 및 마찰 모델을 하드 제약으로 단계별 등식 및 부등식으로 강제한다.
  • 에너지 기반 측정 및 토크 없는 관찰을 활용하여 마찰 관측성을 향상한다.
  • 장시간 흐름 SysID를 위한 해석적으로 도함수를 갖춘 스케일러블한 등식 제약 리카티 해를 개발한다.
  • 모의실험 및 하드웨어에서 수렴 속도와 파라미터 정확도를 향상시키고, MPC 기반의 성능 향상을 시위한다.

제안 방법

  • 베이지안 SysID를 하이브리드 역역학 모델과 동적 일관성 및 물리적 타당성을 강제하기 위한 등식/부등식 제약(Eq. 1a–1f)과 함께 구성한다.
  • 해석적으로 도함수를 갖는 파라미터화된 정방향/역방향 역역학을 사용하여 최적화에 필요한 민감도를 얻는다.
  • 모드와 충격에서의 운동 제약 및 가우스 원리에 의한 재설정 맵을 폐쇄 루프 키네마틱스, 양방향 접촉 및 잔류 제약으로 통합한다.
  • 마찰을 미분 가능하고 에너지 인식이 가능한 리그레서로 모델링하고 정지(stiction), 건식, 점성 및 스트리벡 효과를 포착하며, 에너지 기반 관측으로 측정을 보강한다.
  • 리 군 및 제약 일관 교란 투영을 활용하여 물리적 일관성을 유지하면서 확장성을 가능하게 한다.
  • 구조화된 KKT 시스템을 장기간 다속도 데이터 세트에 대해 효율적으로 풀기 위해 등식 제약 리카티 재귀(및 도함수)를 도출하고 사용한다.
Figure 1 : The Unitree B1 quadruped robot performing a step-up maneuver. The leg includes a reduction gear and a four-bar linkage, both explicitly modeled as constraints within our SysID framework. The highlighted cross-section reveals the internal linkage bars, whose inertial properties and actuato
Figure 1 : The Unitree B1 quadruped robot performing a step-up maneuver. The leg includes a reduction gear and a four-bar linkage, both explicitly modeled as constraints within our SysID framework. The highlighted cross-section reveals the internal linkage bars, whose inertial properties and actuato

실험 결과

연구 질문

  • RQ1접촉 및 루프 제약 하에서 확장형 베이스 로봇의 상태, 교란, 작용 효과 및 물리 파라미터를 공동으로 어떻게 추정할 수 있는가?
  • RQ2토크 센싱이 제한되거나 없는 경우 에너지 기반 관측이 마찰 파라미터의 식별성 및 추정에 어떤 도움을 주는가?
  • RQ3등식 제약 리카티 솔버가 장시간 시간 horizon에서 확장 가능한 베이지안 SysID를 가능하게 하는가?
  • RQ4에너지 일관 사전분포와 제약 인식형 형식이 정확도와 강건성 면에서 순방향 역학 또는 분리된 SysID 기반과 비교하여 우수한가?
  • RQ5도전적인 환경에서의 보행 모델 예측 제어에 적용될 때 식별된 모델이 어떤 성능 향상을 제공하는가?

주요 결과

  • 시뮬레이션 및 하드웨어 실험에서 순방향 역학 및 분리된 베이스라인에 비해 파라미터 추정 정확도와 수렴 속도가 향상된다.
  • 명시적 제약 내재화 및 동적 모델링으로 접촉 및 루프 종료 일관성이 향상된다.
  • 에너지 기반 관측이 마찰 효과를 구분하는 데 도움을 주고 토크 센싱이 직접 불가능한 경우 식별성을 개선한다.
  • 제안된 프레임워크로 식별된 모델은 도전적인 지형에서의 보행을 위한 MPC 내에서 추적 성능을 측면에서 측정 가능한 개선을 보인다.
Figure 2 : Overview of the our Bayesian optimization pipeline for system identification. Proprioceptive measurements (e.g., encoders, IMU) and optional exteroceptive measurements (e.g., visual odometry/ICP) are synchronized and used to jointly estimate the state trajectory, disturbances, actuation e
Figure 2 : Overview of the our Bayesian optimization pipeline for system identification. Proprioceptive measurements (e.g., encoders, IMU) and optional exteroceptive measurements (e.g., visual odometry/ICP) are synchronized and used to jointly estimate the state trajectory, disturbances, actuation e

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.