Skip to main content
QUICK REVIEW

[논문 리뷰] SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems

Robin Strässer, Manuel Schaller|arXiv (Cornell University)|2024. 02. 05.
Control Systems and Identification인용 수 8
한 줄 요약

SafEDMD는 EDMD를 통해 비선형 시스템의 데이터 기반 이차 대체물(쌍선형 대체물)을 도입하고, 원점에서 소멸하는 비례 오차 한계를 통해 폐루프 지수 안정성을 보장하는 제어기를 가능하게 한다. 이 방법은 이산 시간, 도함수 미사용 데이터에 대해 기존 Koopman 기반 방법보다 신뢰성을 입증한다.

ABSTRACT

The Koopman operator serves as the theoretical backbone for machine learning of dynamical control systems, where the operator is heuristically approximated by extended dynamic mode decomposition (EDMD). In this paper, we propose SafEDMD, a novel stability- and feedback-oriented EDMD-based controller design framework. Our approach leverages a reliable surrogate model generated in a data-driven fashion in order to provide closed-loop guarantees. In particular, we establish a controller design based on semi-definite programming with guaranteed stabilization of the underlying nonlinear system. As central ingredient, we derive proportional error bounds that vanish at the origin and are tailored to control tasks. We illustrate the developed method by means of several benchmark examples and highlight the advantages over state-of-the-art methods.

연구 동기 및 목표

  • Koopman 연산자를 사용하여 알려지지 않은 비선형 동적 시스템에 대한 데이터 기반의 안정성-피드백 지향 제어기 설계를 제공한다.
  • 오차가 원점에서 소멸하는 특성을 갖는 EDMD를 통해 학습된 쌍선형 대체 모델을 개발한다.
  • 예측 가능한 영역 내에서 폐루프 지수 안정성을 보장하는 상태 피드백 제어기를 설계한다.
  • 유한 데이터 오차 한계가 강인 제어 보장과 RoA(가용영역)에 미치는 영향을 정량화한다.
  • 벤치마크 비선형 시스템에 이 방법을 시연하고 최신 방법과 비교한다.

제안 방법

  • 미지의 비선형 제어-선형 시스템을 관측치 사전에 대한 이산 Koopman 연산자로 표현한다.
  • 상수 제어 입력과 그 단위 벡터에서 얻은 데이터를 사용하여 EDMD로 구조화된 쌍선형 대체 모델을 학습한다.
  • 상수 부와 비상수 부를 분리하는 블록 구조의 Koopman 형태를 도입하고, 최소제곱 회귀로 A, b0,i, Bi를 추정한다.
  • 원점에서 소멸하는 비례 오차 bound를 도출하여 상승된 상태(Lifted-state) 근사 오차를 한정한다(정리 3.1).
  • 학습된 모델과 오차 한계를 이용한 데이터 기반 제어기를 제안하여 특정 가용영역에서 지수 안정성을 보장한다(정리 4.1).
  • 샘플링된 피드백을 통해 연속 시간 안정성을 보장하는 연속 시간의 코롤러를 제공한다(코롤러 4.2).

실험 결과

연구 질문

  • RQ1데이터 기반 EDMD 접근 방법이 알려지지 않은 비선형 제어-선형 시스템에 대해 어떻게 쌍선형 대체물을 도출할 수 있는가?
  • RQ2원점에서 소멸하는 오차 한계를 가진 유한 데이터 Koopman 근사가 신뢰성 있는 제어를 가능하게 하는가?
  • RQ3이러한 대체물을 이용해 폐루프 지수 안정성을 보장하는 피드백 제어기를 어떻게 설계할 수 있는가?
  • RQ4데이터 양, 샘플링 속도와 결과적으로 얻어지는 가용영역 및 안정성 보장 간 관계는 무엇인가?
  • RQ5SafEDMD가 안정성 보장 및 실용적 성능 측면에서 기존의 Koopman 기반 제어 방법과 어떻게 비교되는가?

주요 결과

  • 구조화된 EDMD 기반 아키텍처(SafEDMD)가 원점에서 소멸하는 오차 한계를 갖는 Koopman 연산자의 쌍선형 대체물을 학습한다.
  • 정리 3.1은 학습된 대체물에 대해 데이터 의존적이고 비례적인 오차 한계를 제공하여 강인한 제어기 설계를 가능하게 한다.
  • 정리 4.1은 유한 데이터와 학습된 모델에 기반하여 특정 가용영역에서 지수 안정성을 달성하는 상태 피드백 제어기의 존재를 증명한다.
  • 코롤러 4.2는 샘플링된 피드백 하에서 연속 시간 비선형 시스템에 대한 안정성 보장을 확장한다.
  • 비선형 벤치마크(예: 비선형 역전 Pendulum)에서 SafEDMD가 EDMDc 기반의 LQR이 실패하는 경우를 안정화시키는 것을 보이고, 계산이 빠르게 한 세컨드 이하로 처리된다.
  • 이 방법은 도함수 데이터 없이도 가능하며 벡터 필드의 도함이가 필요한 방법들과 달리 이산 상태 샘플에만 의존한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.