Skip to main content
QUICK REVIEW

[论文解读] Learning control for polynomial systems using sum of squares.

Meichen Guo, Claudio De Persis|arXiv (Cornell University)|Apr 2, 2020
Advanced Control Systems Optimization被引用 10
一句话总结

该论文提出了一种数据驱动方法,通过平方和(SOS)优化,直接从输入-输出数据中学习非线性多项式系统的稳定控制律,无需进行系统辨识。通过仅基于有限时间间隔内采集的输入-输出数据,将控制设计问题表述为SOS优化问题,实现了基于数据的线性规划来合成状态依赖的控制增益,从而在不显式估计系统动力学的情况下确保稳定性。

ABSTRACT

This paper considers the problem of learning control laws for nonlinear polynomial systems directly from data, which are input-output measurements collected in an experiment over a finite time period. Without explicitly identifying the system dynamics, stabilizing laws are directly designed for nonlinear polynomial systems by solving sum of square problems that depend on the experimental data alone. Moreover, the stabilizing state-dependent control gains can be constructed by data-based linear programming.

研究动机与目标

  • 开发一种无需显式系统辨识的非线性多项式系统的数据驱动控制设计方法。
  • 利用平方和优化技术确保所得到控制律的闭环稳定性。
  • 直接从实验输入-输出数据中构建稳定的状态依赖控制增益。
  • 通过仅依赖测量数据,消除对系统动力学先验知识的需求。
  • 通过基于数据的线性规划公式,实现控制律的高效计算。

提出的方法

  • 该方法仅使用在有限时间间隔内采集的输入-输出测量数据,将控制设计问题表述为平方和(SOS)优化问题。
  • 利用多项式基函数表示控制律和李雅普诺夫函数,从而能够使用SOS规划进行稳定性验证。
  • 通过将数据约束直接嵌入SOS优化框架,避免了系统辨识。
  • 通过利用数据和多项式约束的结构,采用线性规划计算稳定控制增益。
  • 通过满足从数据中推导出的SOS条件,确保所得到的控制律能够稳定系统。
  • 整个设计过程完全基于数据,仅依赖于实验测量数据,无需显式系统方程。

实验结果

研究问题

  • RQ1是否可以仅从输入-输出数据中直接学习到稳定控制律,而无需识别底层系统动力学?
  • RQ2平方和优化如何适应于实验数据,以应用于非线性多项式系统?
  • RQ3何种条件可确保基于数据的控制律保证闭环稳定性?
  • RQ4是否可以仅使用数据和线性规划高效计算状态依赖的控制增益?
  • RQ5多项式基函数在实现基于数据的SOS控制合成中起到什么作用?

主要发现

  • 所提出的方法成功地仅使用输入-输出数据,无需系统辨识,即设计出多项式系统的稳定控制律。
  • 通过直接从实验测量中推导出的平方和条件,保证了闭环系统的稳定性。
  • 控制增益为状态相关,并可通过线性规划高效计算,从而支持实际应用。
  • 该方法避免了系统辨识带来的计算负担,同时保持了稳定性方面的理论保证。
  • 该方法适用于广泛的非线性多项式系统,展现出设计的通用性和对数据的鲁棒性。
  • 该框架实现了直接的数据驱动控制合成,为传统系统辨识与控制设计流程提供了一种可行的替代方案。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。