Skip to main content
QUICK REVIEW

[논문 리뷰] Stochastic MPC with Dynamic Feedback Gain Selection and Discounted Probabilistic Constraints

Shuhao Yan, Paul J. Goulart|arXiv (Cornell University)|2020. 07. 14.
Advanced Control Systems Optimization참고 문헌 38인용 수 13
한 줄 요약

이 논문은 비정상적인 추가 외란이 존재하는 선형 이산시간 시스템을 대상으로, 동적 피드백 이득 선택 및 할인 확률 제약 조건을 사용하는 확률적 모델 예측 제어(MPC) 프레임워크를 제안한다. 체비셰프 부등식을 통해 확률 제약 조건을 재구성하고 온라인 제약 조건 강화 기법을 도입함으로써, 외란이 유계가 아님을 전제로 하더라도 재귀적 타당성과 이차 안정성을 보장하며, 고정 이득 MPC에 비해 보수성 감소와 함께 닫힘 루프 성능 향상을 이룬다.

ABSTRACT

This paper considers linear discrete-time systems with additive disturbances, and designs a Model Predictive Control (MPC) law incorporating a dynamic feedback gain to minimise a quadratic cost function subject to a single chance constraint. The feedback gain is selected online and we provide two selection methods based on minimising upper bounds on predicted costs. The chance constraint is defined as a discounted sum of violation probabilities on an infinite horizon. By penalising violation probabilities close to the initial time and assigning violation probabilities in the far future with vanishingly small weights, this form of constraints allows for an MPC law with guarantees of recursive feasibility without a boundedness assumption on the disturbance. A computationally convenient MPC optimisation problem is formulated using Chebyshev's inequality and we introduce an online constraint-tightening technique to ensure recursive feasibility. The closed loop system is guaranteed to satisfy the chance constraint and a quadratic stability condition. With dynamic feedback gain selection, the closed loop cost is reduced and conservativeness of Chebyshev's inequality is mitigated. Also, a larger feasible set of initial conditions can be obtained. Numerical simulations are given to show these results.

연구 동기 및 목표

  • 최악의 외란 한계에 의존하는 전통적 확률적 MPC 방법의 보수성을 해소하기 위해.
  • 유계 외란이 아닌 추가 외란이 존재하는 시스템에서도 재귀적 타당성을 달성하기 위해, 일반적으로 유계 외란이 아니면 달성하기 어려운 강건한 제약 조건 강화 없이 MPC에서 재귀적 타당성을 보장하기 위해.
  • 예측 비용 상한의 최소화를 위해 온라인에서 적응하는 동적 피드백 이득 선택을 도입함으로써 닫힘 루프 성능을 향상시키기 위해.
  • 종단 비용 또는 유계 외란 가정 없이도 이차 안정성과 제약 조건 이행을 보장하기 위해.
  • 체비셰프 부등식의 보수성을 줄이기 위해 적응형 피드백 이득 튜닝을 통해 확률 제약 조건 근사에서의 보수성을 감소시키기 위해.

제안 방법

  • 무한 수렴 기간 동안 위반 확률의 할인 합을 사용하여 근접한 제약 조건 이행을 우선시하고, 확률 제약 조건의 잘 정의됨을 보장한다.
  • 외란의 일차 및 이차 모멘트만을 사용하여 체비셰프 부등식을 확률 제약 조건에 적용함으로써, 이를 볼록 이차 제약 조건으로 변환한다.
  • 유계 외란이 필요 없이도 수축 수평 최적화의 재귀적 타당성을 보장하기 위해 온라인 제약 조건 강화 기법을 도입한다.
  • 오프라인 다목적 최적화 문제를 풀어 안정화 가능한 이득 집합을 사전에 생성한 후, 예측 비용 상한의 최소화를 위해 온라인에서 이득을 선택함으로써 동적 피드백 이득 선택을 구현한다.
  • 두 가지 온라인 이득 선택 전략을 제안한다: 하나는 최적 예측 비용 상한의 최소화를 위한 것이고, 다른 하나는 거의 확실하게 비제약 LQ 최적 이득으로 수렴을 보장하기 위한 것이다.
  • 닫힘 루프 시스템이 확률 제약 조건을 이행하고 이차 안정성 조건을 만족함을 증명하였으며, 리아푸노프 분석과 보렐-칸텔리 보조정리에 의해 성능 한계를 유도하였다.

실험 결과

연구 질문

  • RQ1비유계 추가 외란이 존재하는 상황에서, 유계 외란 가정 없이도 제약 조건 강화 없이 할인 확률 제약 조건을 갖춘 확률적 MPC가 재귀적 타당성을 확보할 수 있는가?
  • RQ2동적 피드백 이득 선택은 확률 제약 조건 MPC에서 체비셰프 부등식의 보수성을 어떻게 감소시킬 수 있는가?
  • RQ3온라인 이득 선택은 초기 조건의 가용 영역 크기와 장기 평균 기대 비용에 어떤 영향을 미치는가?
  • RQ4제안된 동적 선택 규칙 하에 피드백 이득이 거의 확실하게 비제약 LQ 최적 해로 수렴할 수 있는가?
  • RQ5제안된 제약 조건 강화 기법은 재귀적 타당성을 보장하면서도 닫힘 루프 작동 중 제약 조건 이행을 유지하는 데 어떻게 기여하는가?

주요 결과

  • 제안된 MPC 알고리즘은 유계 외란이나 종단 제약 조건이 없이도 온라인 최적화 문제의 재귀적 타당성을 보장한다.
  • 닫힘 루프 시스템은 확률 제약 조건을 이행하고, 종단 비용 또는 제약 조건 항이 없더라도 이차 안정성을 달성한다.
  • 동적 피드백 이득 선택은 체비셰프 부등식의 보수성을 감소시켜 장기 평균 기대 비용 측면에서 향상된 닫힘 루프 성능을 이룬다.
  • 적절한 초기 피드백 이득을 선택함으로써 허용 가능한 초기 조건의 집합이 확대되어 안정성 영역이 증가한다.
  • 제안된 온라인 선택 규칙 하에 피드백 이득이 거의 확실하게 비제약 LQ 최적 해로 수렴함을 보여주었으며, 이는 보렐-칸텔리 보조정리를 사용하여 증명되었다.
  • 수치 시뮬레이션 결과, 특히 비유계 외란 하에서 고정 이득 MPC에 비해 제안된 방법이 닫힘 루프 비용과 제약 위반 비율을 감소시킴을 확인하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.