[论文解读] Smooth Sampling-Based Model Predictive Control Using Deterministic Samples
dsMPPI 将确定性采样与 MPPI 风格的指数加权相结合,在非线性 MPC 中产生更平滑的控制输入,而无需额外的在线计算。在输入平滑度方面优于 MPPI 和 dsCEM,同时保持有竞争力的成本。
Sampling-based model predictive control (MPC) is effective for nonlinear systems but often produces non-smooth control inputs due to random sampling. To address this issue, we extend the model predictive path integral (MPPI) framework with deterministic sampling and improvements from cross-entropy method (CEM)--MPC, such as iterative optimization, proposing deterministic sampling MPPI (dsMPPI). This combination leverages the exponential weighting of MPPI alongside the efficiency of deterministic samples. Experiments demonstrate that dsMPPI achieves smoother trajectories compared to state-of-the-art methods.
研究动机与目标
- 提高对采样基 MPC 中更平滑控制输入的需求的动力,以降低执行器磨损和抖动。
- 提出将确定性采样与指数 MPPI 加权相融合的 dsMPPI。
- 利用时相关的确定性样本和动量平滑来改善探索性和稳定性。
- 在保持对非线性任务的竞争性能的同时,展示对控制输入平滑性的提升。
提出的方法
- 使用迭代的、类似 MPPI 的更新,结合重要性权重和成本平移以实现数值稳定。
- 仅更新高斯提案的边际方差以降低计算量。
- 利用 L_j 和协方差的平方根将预计算的确定性样本转换至当前提案。
- 在迭代之间引入动量平滑以更新均值和协方差。
- 自适应地基于归一化常数 eta 调整反温度 lambda_j。
- 引入确定性样本的变化方案(置换和多次迭代)以增强探索。
- 通过托普利茨结构构造具有固定时间相关矩阵 C_rho 的时序相关采样,以捕捉时间平滑性。
- 将控制输入限制在边界并使用缓冲区在多次迭代中保留最佳轨迹。
- 使用上一步 MPC 步骤的平移序列对提案进行热启动。

实验结果
研究问题
- RQ1确定性采样结合 MPPI 加权是否相对于标准 MPPI 和 dsCEM 提高轨迹平滑性?
- RQ2置换和多次迭代的变化方案如何影响性能和探索?
- RQ3与随机采样 MPC 方法相比,dsMPPI 的计算开销如何?
- RQ4时序相关采样与动量平滑是否能提升 dsMPPI 的稳定性与收敛性?
主要发现
| 方法 | 小车-摆(ms) | 卡车-倒带(ms) |
|---|---|---|
| MPPI | 0.0571 ± 0.0084 | 0.0107 ± 0.0004 |
| MPPI 迭代 | 0.1666 ± 0.0229 | 0.0357 ± 0.0020 |
| dsMPPI 置换 | 0.1675 ± 0.0274 | 0.0374 ± 0.0026 |
| dsMPPI 多迭代 | 0.1667 ± 0.0255 | 0.0373 ± 0.0027 |
| dsCEM 置换 | 0.1661 ± 0.0239 | 0.0356 ± 0.0028 |
| dsCEM 多迭代 | 0.1670 ± 0.0242 | 0.0358 ± 0.0032 |
- dsMPPI 在较大样本数时比 MPPI 和 dsCEM 提供更平滑的控制输入。
- 置换变化在所测试任务中对累计成本的提升优于多次迭代方案。
- 在没有额外的在线计算开销的前提下,dsMPPI 以与随机采样 MPC 方法相比的竞争成本实现了竞争性的累计成本。
- 在小车摆动上升和卡车倒车任务的稳定性指标上,dsMPPI 的平滑性优于标准 MPPI。
- 该方法在保持性能的同时利用确定性样本提高了样本效率。
- dsMPPI 的每步计算时间与其他迭代方法相似,显著高于标准 MPPI,但与随机采样相比没有额外在线成本。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。