[论文解读] Data-driven Stabilization of SISO Feedback Linearizable Systems
该论文提出了一种数据驱动的控制方法,用于稳定单输入单输出(SISO)反馈线性化系统,无需系统模型或先验数据。通过利用改进的智能PID类控制器及近似模型控制的理论基础,该方法在仅使用最少数据且不依赖持续激励假设的条件下,保证了渐近稳定性,并在有界导数估计误差下对测量噪声具有鲁棒性。
In this paper we propose a methodology for stabilizing single-input single-output feedback linearizable systems when no system model is known and no prior data is available to identify a model. Conceptually, we have been greatly inspired by the work of Fliess and Join on intelligent PID controllers and the results in this paper provide sufficient conditions under which a modified version of their approach is guaranteed to result in asymptotically stable behavior. One of the key advantages of the proposed results is that, contrary to other approaches to controlling systems without a model (or with a partial model), such as reinforcement learning, there is no need for extensive training nor large amounts of data. Technically, our results draw heavily from the work of Nesic and co-workers on observer and controller design based on approximate models. Along the way we also make connections with other well established results such as high-gain observers and adaptive control. Although we focus on the simple setting of single-input single-output feedback linearizable systems we believe the presented results are already theoretically insightful and practically useful, the last point being substantiated by experimental evidence.
研究动机与目标
- 开发一种在无系统模型或先验数据的情况下,适用于SISO反馈线性化系统的数据驱动控制策略。
- 正式证明Fliess和Join的智能PID控制器中所采用的工作假设:即信号在采样周期之间近似恒定。
- 在不依赖持续激励的条件下,确保渐近稳定性,这与大多数自适应控制技术不同。
- 最小化数据和训练需求,使该方法与强化学习和深度学习方法相区别。
- 提供一种理论基础坚实、实用性强的控制方法,采用紧凑的有限维状态估计和线性控制技术。
提出的方法
- 使用一种动态控制器,通过高阶泰勒近似估计感测信号的导数,依赖于采样测量值。
- 应用Fliess和Join的智能PID框架的改进版本,其中控制输入根据误差和导数估计值进行更新。
- 利用从采样数据中获得的系统动态近似模型,通过李雅普诺夫函数实现稳定性分析。
- 引入复合李雅普诺夫函数 $ W = V_z + V_{e_u} $,结合状态和误差动态,以分析稳定性。
- 采用时间离散化的控制律,采样周期为 $ T $,其中控制更新依赖于误差 $ e_u $、导数估计值和噪声界限。
- 通过证明 $ W $ 的子水平集在有界测量噪声 $ ar{d} $ 下的正不变性,建立有界性和收敛性。
实验结果
研究问题
- RQ1在无任何系统模型或先验数据的情况下,数据驱动控制器能否稳定SISO反馈线性化系统?
- RQ2在无持续激励的条件下,智能PID类控制器在何种条件下可确保渐近稳定性?
- RQ3如何形式化从采样数据中进行导数估计,以确保非线性系统中的稳定性?
- RQ4采样率和噪声界限在实现稳定、有界轨迹中起什么作用?
- RQ5能否使用近似模型控制技术来严格证明数据驱动控制框架中的假设?
主要发现
- 所提方法仅使用采样测量值且无需系统模型,即可保证SISO反馈线性化系统的渐近稳定性。
- 该方法在不依赖持续激励的条件下实现稳定性,相较于大多数自适应控制技术具有显著优势。
- 控制器仅需极少数据,且无需离线或在线训练,与强化学习和深度学习方法形成鲜明对比。
- 在测量噪声下,所有信号的有界性已得到证明,轨迹收敛至原点邻域,其半径为 $ r = ar{d} T^{-n} ig( rac{ u}{M} ig)^{-1/2} $。
- 该方法确保所有信号保持有界,其中 $ ar{d} < b_1 = ig( rac{ u}{M} ig)^{1/2} c_2 T^n $,$ c_2 $ 为不变集边界的一个正常下界。
- 通过将该方法与Nesic的近似模型控制理论及高增益观测器理论相联系,提供了理论依据。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。