QUICK REVIEW

[论文解读] Quasi-Invariant Optimal Control Problems

Delfim F. M. Torres|ArXiv.org|Feb 21, 2003

Optimization and Variational Analysis参考文献 19被引用 21

一句话总结

本文通过引入广义的拟不变性概念，将诺特定理推广至最优控制问题，使得即使在问题仅对变换参数的一阶项保持不变时，也能推导出守恒律。关键贡献是提出了一类新型诺特型定理，可识别在庞特里亚金极值轨线上的守恒量，适用于拟不变系统，通过时间最优控制实例加以验证，这些实例中经典不变性不成立。

ABSTRACT

We study in optimal control the important relation between invariance of the problem under a family of transformations, and the existence of preserved quantities along the Pontryagin extremals. Several extensions of Noether theorem are provided, in the direction which enlarges the scope of its application. We formulate a more general version of Noether's theorem for optimal control problems, which incorporates the possibility to consider a family of transformations depending on several parameters and, what is more important, to deal with quasi-invariant and not necessarily invariant optimal control problems. We trust that this latter extension provides new possibilities and we illustrate it with several examples, not covered by the previous known optimal control versions of Noether's theorem.

研究动机与目标

通过将严格不变性要求放宽为在单参数变换族下的拟不变性，推广最优控制中的诺特定理。
建立更广泛的最优控制中守恒律推导框架，适用于不严格不变但满足一阶不变性条件的问题。
提供一种系统化方法，用于识别拉格朗日函数和动力学在变换参数的 o(s) 阶项内不变的最优控制系统的守恒量。
通过超出以往最优控制版本诺特定理适用范围的实例，展示新定理的适用性。
通过引入多参数变换和拟不变性，统一并扩展文献中现有结果，结合庞特里亚金最大值原理。

提出的方法

为最优控制问题引入广义的拟不变性定义，其中变换后的泛函与原泛函之差为变换参数 s 的 o(s) 阶项。
推导出一个新的诺特型定理（定理 5.1），将单参数变换族下的拟不变性与庞特里亚金极值轨线上守恒量的存在性联系起来。
应用哈密顿形式和庞特里亚金最大值原理，推导最优性的必要条件，包括伴随系统和最大值条件。
利用基本不变性定理（定理 4.1）通过检查变换后状态和控制变量的时间导数是否与原动力学在 o(s) 项内一致，来验证拟不变性。
通过涉及变换生成元的偏导数与共轭变量 ψ 的公式构造守恒量。
在时间最优控制问题（L=1）上验证该方法，其中泛函和动力学虽不严格不变，但满足拟不变性条件（F≡0 或 F≠0），从而导出精确守恒律。

实验结果

研究问题

RQ1诺特定理在最优控制中能否推广至不严格不变但对变换参数一阶项保持拟不变的系统？
RQ2在多参数变换下，最优控制问题中守恒量的一般形式是什么？
RQ3如何系统地通过变换变量的时间导数验证控制系统的拟不变性及其相关泛函？
RQ4在哪些最优控制问题类别中——特别是时间最优问题或非恒定拉格朗日函数问题——新拟不变性框架能导出经典诺特定理无法获得的新守恒律？
RQ5当通过选择适当的函数 F 使泛函变为至多一个全微分时，守恒量如何变化？

主要发现

本文建立了新的诺特型定理（定理 5.1），保证了在单参数变换族下拟不变的最优控制问题，其庞特里亚金极值轨线上存在守恒量。
在例 6.3 中，由于在指定变换下满足拟不变性，守恒律 $ \psi_{1}(t)(x_{1}(t)-t) + \psi_{2}(t)x_{2}(t) + \psi_{3}(t)x_{3}(t) + 2\psi_{4}(t)x_{4}(t) \equiv \text{constant} $ 成立。
在例 6.4 中，守恒量 $ 2\psi_{x}(x-t) + \psi_{y}y + \psi_{z}z $ 由包含动力学中 o(s) 项的拟不变变换导出。
当泛函被修改为包含一个全微分（例如 $ F = s x_3 $ 或 $ F = s z $）时，问题变为严格不变，守恒量相应增加额外项 $ \psi_0 x_3 $ 或 $ \psi_0 z $。
该方法成功识别出经典不变性不成立的时间最优控制问题中的新守恒律，展示了拟不变性框架更广泛的应用潜力。
该框架支持多参数变换，将诺特定理的适用范围从经典不变性扩展至更广领域，使此前难以处理的情形中也能发现守恒量。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。