Skip to main content
QUICK REVIEW

[论文解读] Successive Convexification for Trajectory Optimization with Continuous-Time Constraint Satisfaction

Purnanand Elango, Dayou Luo|arXiv (Cornell University)|Apr 25, 2024
Vehicle Routing Optimization Methods被引用 14
一句话总结

本论文提出连续凸化(successive convexification),一种基于实时 SCP 的非凸轨迹优化方法,具备连续时间约束满足与收敛性保证,采用外部惩罚、时间拉伸、多射击以及精确惩罚框架。

ABSTRACT

We present successive convexification, a real-time-capable solution method for nonconvex trajectory optimization, with continuous-time constraint satisfaction and guaranteed convergence, that only requires first-order information. The proposed framework combines several key methods to solve a large class of nonlinear optimal control problems: (i) exterior penalty-based reformulation of the path constraints; (ii) generalized time-dilation; (iii) multiple-shooting discretization; (iv) $\ell_1$ exact penalization of the nonconvex constraints; and (v) the prox-linear method, a sequential convex programming (SCP) algorithm for convex-composite minimization. The reformulation of the path constraints enables continuous-time constraint satisfaction even on sparse discretization grids and obviates the need for mesh refinement heuristics. Through the prox-linear method, we guarantee convergence of the solution method to stationary points of the penalized problem and guarantee that the converged solutions that are feasible with respect to the discretized and control-parameterized optimal control problem are also Karush-Kuhn-Tucker (KKT) points. Furthermore, we highlight the specialization of this property to global minimizers of convex optimal control problems, wherein the reformulated path constraints cannot be represented by canonical cones, i.e., in the form required by existing convex optimization solvers. In addition to theoretical analysis, we demonstrate the effectiveness and real-time capability of the proposed framework with numerical examples based on popular optimal control applications: dynamic obstacle avoidance and rocket landing.

研究动机与目标

  • 在 GNC 系统中的连续时间可行轨迹优化的必要性提供动机。
  • 开发一个实时、一阶的 SCP 基框架,保证收敛到驻点。
  • 在稀疏离散化上实现连续时间约束的满足,而无需网格细化。
  • 提供一种重构/改写,使得对广泛的非线性最优控制问题(OCP)能够获得可行性保证。
  • 证明其在动态障碍物避免和火箭着陆等领域的适用性。

提出的方法

  • 将路径约束基于外部惩罚项重构为惩罚性辅助系统。
  • 广义时间膨胀/时间延展将自由结束时间的问题转换为固定结束时间的形式。
  • 多射击离散化以在稀疏网格上保留可行性。
  • 对非凸约束进行 ℓ1 精确惩罚,以强制实现约束满足。
  • Prox-linear 方法作为用于凸-复合最小化的序列凸规划方法。
  • 建立理论基础,确保对惩罚问题收敛到驻点,并且对可行离散化出现 KKT 点。

实验结果

研究问题

  • RQ1在离散化、参数化的轨迹优化框架下,是否能够保证连续时间状态与输入约束的可行性?
  • RQ2采用带外部惩罚和时间膨胀的重构是否能保证收敛到惩罚问题的驻点?
  • RQ3Prox-linear SCP 方法是否能够在确保收敛性与可行性的同时实现对非凸轨迹优化的实时可解性?
  • RQ4与凸情况相比,该框架在动态障碍物避让和火箭着陆等非凸应用上的表现如何?
  • RQ5对于凸与非凸运行代价与约束,重构的含义与局限性是什么?

主要发现

  • 该框架保证解对 ℓ1 惩罚问题的驻点收敛。
  • 对离散化问题可行的收敛解是原始问题的 KKT 点。
  • 该重构即使在稀疏离散网格上也能实现连续时间约束满足,避免网格细化启发式。
  • 演示包括动态障碍物避让和 6-DoF 火箭着陆(非凸)以及通过无损凸化实现的凸性 3-DoF 火箭着陆。
  • 通过对所提框架使用 sc vx gen 生成的 C 代码,展示实时能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。