Skip to main content
QUICK REVIEW

[논문 리뷰] Learning Compositional Koopman Operators for Model-Based Control

Yunzhu Li, Hao He|arXiv (Cornell University)|2019. 10. 18.
Model Reduction and Neural Networks참고 문헌 41인용 수 32
한 줄 요약

이 논문은 그래프 신경망으로 학습된 구성적 Koopman 연산자를 도입하여 다중 물체 동역학을 모델링하고 컨트롤하며 물체 수가 가변적인 상황에서 효율적인 식별 및 MPC 기반 제어를 가능하게 한다.

ABSTRACT

Finding an embedding space for a linear approximation of a nonlinear dynamical system enables efficient system identification and control synthesis. The Koopman operator theory lays the foundation for identifying the nonlinear-to-linear coordinate transformations with data-driven methods. Recently, researchers have proposed to use deep neural networks as a more expressive class of basis functions for calculating the Koopman operators. These approaches, however, assume a fixed dimensional state space; they are therefore not applicable to scenarios with a variable number of objects. In this paper, we propose to learn compositional Koopman operators, using graph neural networks to encode the state into object-centric embeddings and using a block-wise linear transition matrix to regularize the shared structure across objects. The learned dynamics can quickly adapt to new environments of unknown physical parameters and produce control signals to achieve a specified goal. Our experiments on manipulating ropes and controlling soft robots show that the proposed method has better efficiency and generalization ability than existing baselines.

연구 동기 및 목표

  • 비선형 다물체 동역학 시스템의 효율적 시스템 식별 및 제어를 목표로 한다.
  • 개체 수에 따라 확장 가능한 구성적 Koopman 프레임워크를 제안한다.
  • 객체 중심의 Koopman 임베딩을 얻기 위해 그래프 신경망을 활용한다.
  • 유사한 상호작용 간의 다이나믹스를 공유하기 위해 블록 구조의 Koopman 연산자를 강제한다.
  • 밧줄 및 소프트 로봇 실험에서 일반화 및 제어 성능의 향상을 입증한다.

제안 방법

  • 시스템 상태를 객체 중심의 Koopman 임베딩 g^t = φ(x^t)로 매핑하기 위해 그래프 신경망을 사용한다.
  • 객체 관계를 반영하기 위해 블록 구조의 Koopman 행렬 K와 블록 구조의 제어 행렬 L을 가정한다.
  • 데이터로부터 구조화된 시그마 텐서(K = σ ⊗ K̂, L = σ ⊗ L̂)로 K와 L을 최소제곱 회귀로 식별한다.
  • 오토인코더, 예측, 및 계량 손실(L_ae, L_pred, L_metric)로 φ와 그래프 디코더 ψ를 학습한다.
  • 선형화된 Koopman 다이나믹스 g^{t+1} = K g^t + L u^t를 이용해 이 상태로부터의 개방 루프 제어를 이차계획법 및 MPC로 수행한다.

실험 결과

연구 질문

  • RQ1구성적이고 객체 중심의 Koopman 임베딩이 물체 수가 변화하는 시스템에 일반화될 수 있는가?
  • RQ2블록 구조의 Koopman 연산자가 비구조적이거나 수작업으로 설계한 기저에 비해 데이터 효율성과 일반화를 개선하는가?
  • RQ3그래프 기반 Koopman 임베딩이 이차계획법과 MPC를 통한 효율적 제어를 지원하는가?

주요 결과

  • Koopman 행렬의 블록 구조가 밧줄, 소프트, 수영 환경 전반에 걸쳐 시뮬레이션 및 제어 정확도를 개선한다.
  • 비교 기준(Base)로 상호작용 네트워크, 전파 네트워크, 그리고 수작업으로 구성된 Koopman 기저를 사용할 때, 제안 방법이 더 낮은 시뮬레이션 및 제어 오차를 달성한다.
  • 시스템 식별용 데이터가 증가하면 시뮬레이션 정확도가 향상되며, 물체당 임베딩 차원이 약 16에서 강력한 성능을 달성한다.
  • 제안 방법은 보지 못한 물체 수(예: 질량 10–14로 외삽)로의 일반화가 가능하며 상당한 정확성을 보인다.
  • 식별된 선형 다이나믹스를 이용한 개방 루프 제어가 MPC를 통해 목표 상태를 테스트 태스크에서 효율적으로 달성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.