[论文解读] Direct data-driven state-feedback control of general nonlinear systems
论文通过速度形式的 LPV 嵌入将 Fundamental Lemma 扩展到广泛的离散时间非线性系统,能够直接数据驱动地合成带有普遍移位稳定性与耗散性保障的状态反馈控制器,并在一个不平衡圆盘仿真中验证该方法。
Through the use of the Fundamental Lemma for linear systems, a direct data-driven state-feedback control synthesis method is presented for a rather general class of nonlinear (NL) systems. The core idea is to develop a data-driven representation of the so-called velocity-form, i.e., the time-difference dynamics, of the NL system, which is shown to admit a direct linear parameter-varying (LPV) representation. By applying the LPV extension of the Fundamental Lemma in this velocity domain, a state-feedback controller is directly synthesized to provide asymptotic stability and dissipativity of the velocity-form. By using realization theory, the synthesized controller is realized as a NL state-feedback law for the original unknown NL system with guarantees of universal shifted stability and dissipativity, i.e., stability and dissipativity w.r.t. any (forced) equilibrium point, of the closed-loop behavior. This is achieved by the use of a single sequence of data from the system and a predefined basis function set to span the scheduling map. The applicability of the results is demonstrated on a simulation example of an unbalanced disc.
研究动机与目标
- 为难以获得第一性原理模型的非线性系统提供数据驱动控制的动机。
- 利用速度形式表示将 Fundamental Lemma 推广到非线性动力学。
- 将非线性速度形式嵌入到 LPV 框架中,以实现凸数据驱动分析。
- 纯粹从数据中合成一个速度形式的状态反馈控制律,并将其实现为对等式唯一性保障的非线性控制器。
- 通过对不平衡圆盘的仿真来演示该方法,并与直接的 LPV 与 LTI 数据驱动控制器进行比较。
提出的方法
- 将非线性系统表示为速度形式,以获得一个 Admit LPV 表示的时差动力学。
- 使用一组基函数来表达速度形式的 LPV 矩阵为 A_v(p_k) 和 B_v(p_k),调度信号 p_k 由数据计算得到。
- 从收集到的数据和一个持续激励的字典构建闭环的速度表示的基于数据的表述。
- 通过数据驱动的基于 SDP 的综合(通过 LPV Fundamental Lemma 的扩展)来获得一个稳定化的速度控制器 K^v(p_k),并最小化二次成本。
- 将速度形式控制器实现为一个作用于原始系统的带有定点包含互联系统的非线性状态反馈律 K^NL。
- 证明普遍移位稳定性并讨论 USD 的条件,包括将速度耗散性与 USD 联系起来的一个猜想。
实验结果
研究问题
- RQ1速度形式的 LPV 嵌入是否能够为一般的离散时间非线性系统直接实现数据驱动控制设计?
- RQ2将数据驱动的速度形式控制器在实现为非线性控制器时,是否能为底层非线性系统提供普遍移位稳定性与耗散性保障?
- RQ3怎样利用从非线性系统收集的数据,在不明确非线性模型识别的情况下,通过 LPV 框架合成一个稳定化控制器?
- RQ4在实际应用中,与直接的 LPV 与 LTI 数据驱动控制器相比,提出的普遍移位控制器在性能与稳定性保障方面有何差异?
主要发现
- 一个 NL 系统的速度形式表示可以被嵌入 LPV 以实现凸数据驱动控制设计。
- 通过 LPV Fundamental Lemma 的扩展合成的数据驱动速度控制器 K^v(p_k) 为速度形式提供稳定化控制器。
- 速度形式控制器可以实现为一个 NL 状态反馈律 K^NL,提供普遍移位稳定性,并在合理条件下为闭环 NL 系统提供 USD。
- 综合依赖于一个单数据序列和一个预定义的基集合来张成调度映射,PE 数据确保良好定性。
- 在一个不平衡圆盘的仿真中,普遍移位控制器实现了参考跟踪与 USAS 保证,而直接的 LPV 控制器可能无法跟踪参考。
- 该方法与直接的数据驱动 LPV 与 LTI 控制器进行对比,突出在非线性情形下普遍移位控制的优势。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。