Skip to main content
QUICK REVIEW

[论文解读] A Data Driven Approach for Motion Planning of Autonomous Driving Under Complex Scenario.

Chenyang Xi, Tianyu Shi|arXiv (Cornell University)|Apr 18, 2019
Robotic Path Planning Algorithms被引用 3
一句话总结

本文提出了一种基于学习的自动驾驶运动规划框架,结合混合整数二次规划(MIQP)以生成最优变道轨迹,并采用分层监督学习模型实现快速决策。该方法在传统采样与基于优化的方法之上实现了更优的最优性、实时效率和泛化能力,在实验中优于多个基线方法。

ABSTRACT

Intelligent motion planning is one of the core components in automated vehicles, which has received extensive interests. Traditional motion planning methods suffer from several drawbacks in terms of optimality, efficiency and generalization capability. Sampling based methods cannot guarantee the optimality of the generated trajectories. Whereas the optimization-based methods are not able to perform motion planning in real-time, and limited by the simplified formalization. In this work, we propose a learning-based approach to handle those shortcomings. Mixed Integer Quadratic Problem based optimization (MIQP) is used to generate the optimal lane-change trajectories which served as the training dataset for learning-based action generation algorithms. A hierarchical supervised learning model is devised to make the fast lane-change decision. Numerous experiments have been conducted to evaluate the optimality, efficiency, and generalization capability of the proposed approach. The experimental results indicate that the proposed model outperforms several commonly used motion planning baselines.

研究动机与目标

  • 解决传统运动规划方法在复杂驾驶场景下最优性、实时性能和泛化能力方面的局限性。
  • 克服采样方法的次优性以及基于优化方法的计算低效性。
  • 开发一种基于学习的框架,利用高质量、最优的轨迹作为训练数据,实现快速可靠的决策。
  • 通过分层监督学习实现实时、可泛化的复杂交通环境变道决策。

提出的方法

  • 使用混合整数二次规划(MIQP)生成最优变道轨迹作为训练数据集,确保高质量、可行的运动规划。
  • 设计分层监督学习模型以快速预测变道决策,实现实时执行。
  • 在MIQP生成的轨迹上训练学习模型,以嵌入最优行为,同时保持计算效率。
  • 通过学习策略将运动规划问题分解为高层决策与低层轨迹生成。
  • 将学习到的决策模型与快速推理流水线集成,以支持动态环境中实时部署。
  • 利用MIQP的结构化输出引导学习过程,确保学习决策的安全性与可行性。

实验结果

研究问题

  • RQ1基于最优MIQP生成轨迹训练的基于学习的方法,是否能在最优性与效率方面优于传统采样或基于优化的方法?
  • RQ2分层监督学习模型在未见过的复杂交通场景中泛化能力如何?
  • RQ3所提出的框架在提升轨迹质量的同时,能在多大程度上保持实时性能?
  • RQ4使用MIQP生成的最优轨迹作为训练数据,对学习策略的泛化能力与鲁棒性有何影响?

主要发现

  • 所提方法在轨迹最优性方面优于基线采样与基于优化的方法。
  • 基于学习的模型实现了实时决策,其计算效率显著优于传统基于优化的方法。
  • 该模型在训练期间未见过的复杂交通场景中表现出良好的泛化能力,展现出强鲁棒性。
  • 实验结果证实,所提框架在最优性、速度与适应性方面均优于多个成熟的运动规划基线方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。