QUICK REVIEW

[论文解读] SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems

Robin Strässer, Manuel Schaller|arXiv (Cornell University)|Feb 5, 2024

Control Systems and Identification被引用 8

一句话总结

SafEDMD 通过 EDMD 提出一种数据驱动的非线性系统双线性代理，具有原点处消失的比例性误差界，从而实现具有闭环指数稳定性保证的控制器。它在离散时间、无导数数据条件下，展现出相较现有基于 Koopman 的方法的可靠性。

ABSTRACT

The Koopman operator serves as the theoretical backbone for machine learning of dynamical control systems, where the operator is heuristically approximated by extended dynamic mode decomposition (EDMD). In this paper, we propose SafEDMD, a novel stability- and feedback-oriented EDMD-based controller design framework. Our approach leverages a reliable surrogate model generated in a data-driven fashion in order to provide closed-loop guarantees. In particular, we establish a controller design based on semi-definite programming with guaranteed stabilization of the underlying nonlinear system. As central ingredient, we derive proportional error bounds that vanish at the origin and are tailored to control tasks. We illustrate the developed method by means of several benchmark examples and highlight the advantages over state-of-the-art methods.

研究动机与目标

使用 Koopman 运算符对未知非线性动力学系统进行数据驱动、以稳定性与反馈为导向的控制器设计。
通过 EDMD 学习具有原点处误差界为零的双线性代理模型。
设计在一定吸引域内具有闭环指数稳定性的状态反馈控制器。
量化有限数据误差界如何影响鲁棒控制保证与吸引域（RoA）。
在基准非线性系统上验证该方法并与现有方法进行比较。

提出的方法

用作用观测字典的离散时间 Koopman 运算符表示未知的非线性受控仿射系统。
利用来自恒定控制输入及其单位向量的数据，通过 EDMD 学习一个有结构性的双线性代理模型。
imposing（此处应表达“实现”而非英文单词）一个将常量部分与非常量部分分离的块结构 Koopman 形式，从而通过最小二乘回归得到估计量 A、b0,i、Bi。
推导一个在原点处消失的比例误差界，用以界定提升状态近似误差（定理 3.1）。
提出一个数据驱动的控制器设计，利用代理和误差界确保在给定的吸引域内的指数稳定性（定理 4.1）。
提供一个连续时间推论，保证通过采样反馈实现稳定性（引理/推论 4.2）。

实验结果

研究问题

RQ1数据驱动的 EDMD 方法如何为未知的非线性受控仿射系统生成一个双线性代理？
RQ2是否可以为有限数据的 Koopanman 近似建立在原点处消失的误差界，从而实现可靠控制？
RQ3如何利用此类代理设计具有闭环指数稳定性保证的反馈控制器？
RQ4数据量、采样率与由此获得的吸引域和稳定性保证之间的关系是什么？
RQ5SafEDMD 相较于现有的基于 Koopman 的控制方法，在稳定性保证与实际性能方面有何差异？

主要发现

一个结构化的基于 EDMD 的架构（SafEDMD）学习出一个 Koopman 算子的双线性代理，并具有在原点处消失的误差界。
定理 3.1 给出一个与数据相关的比例误差界，用于学习到的代理，从而实现鲁棒控制器设计。
定理 4.1 证明在有限数据和学习模型的基础上，存在一个状态反馈控制器，在给定吸引域内实现指数稳定性。
推论 4.2 将稳定性保证扩展到通过采样反馈实现的连续时间非线性系统。
对非线性基准系统（如非线性倒立摆）的数值实验表明 SafEDMD 在 EDMDc-LQR 失效时仍能实现稳定，并且计算高效（解在一秒内完成）。
该方法不需要导数数据，仅依赖离散状态样本，与需要向量场导数的方法不同。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。