Skip to main content
QUICK REVIEW

[论文解读] Aggressive Deep Driving: Model Predictive Control with a CNN Cost Model

Paul Drews, Grady Williams|arXiv (Cornell University)|Jul 17, 2017
Autonomous Vehicle Technology and Safety参考文献 22被引用 31
一句话总结

本文提出一种基于视觉的模型预测控制(MPC)框架,用于激进式自主驾驶,采用深度卷积神经网络(CNN)直接从单目相机图像预测鸟瞰图成本图。该方法通过学习一种可解释的、实时的可行驶性表征,实现高速、无GPS导航,支持鲁棒轨迹优化,平均圈速达9.74秒——仅比GPS辅助基线慢0.39秒——且在圈速效率上比图像平面回归方法提升12%。

ABSTRACT

We present a framework for vision-based model predictive control (MPC) for the task of aggressive, high-speed autonomous driving. Our approach uses deep convolutional neural networks to predict cost functions from input video which are directly suitable for online trajectory optimization with MPC. We demonstrate the method in a high speed autonomous driving scenario, where we use a single monocular camera and a deep convolutional neural network to predict a cost map of the track in front of the vehicle. Results are demonstrated on a 1:5 scale autonomous vehicle given the task of high speed, aggressive driving.

研究动机与目标

  • 仅使用单目视觉和车载传感器实现激进的高速自主驾驶,消除对GPS或预先构建地图环境的依赖。
  • 开发一种实时、端到端可训练的系统,直接将视觉输入映射到适用于MPC的可行驶性成本图。
  • 探究直接预测鸟瞰图(鸟眼视角)成本图是否在控制性能和鲁棒性方面优于图像平面回归。
  • 通过人类驾驶数据进行训练,实现跨驾驶任务的泛化,而无需针对特定任务重新训练。

提出的方法

  • 使用全卷积神经网络,从单张单目图像预测赛道的鸟瞰图成本图,表征可行驶区域和障碍物。
  • 将预测的成本图直接输入基于采样的模型预测控制(MPPI)算法,实现实时轨迹优化。
  • 利用大规模、人机协同的数据集进行网络训练,通过自动生成的标注实现成本图监督。
  • 系统仅使用单目相机图像、车辆速度和惯性测量作为输入,避免使用GPS或SLAM进行定位。
  • 鸟瞰图成本图使控制器能够预判相机视场范围之外的赛道几何形状,包括不可见的弯道。
  • 该方法支持任务无关训练:由于成本表征解耦且可解释,人类驾驶数据可在不同控制目标间实现泛化。

实验结果

研究问题

  • RQ1深度CNN能否从单目图像中学习预测鸟瞰图可行驶性成本图,从而在无GPS的情况下实现高速、激进的MPC驱动?
  • RQ2与图像平面回归相比,直接预测鸟瞰图成本图在真实自主车辆上的控制性能和鲁棒性是否更优?
  • RQ3当使用人类驾驶数据进行训练时,单一神经网络在多类驾驶任务中的泛化能力达到何种程度?
  • RQ4网络预测相机视场范围之外(如弯道后方)的能力在多大程度上影响控制器性能?
  • RQ5学习得到的、可解释的成本表征是否能提升自动驾驶系统中的故障诊断能力和系统可解释性?

主要发现

  • 基于鸟瞰图的CNN成本图预测在1:5比例的自主车辆上实现了平均9.74秒的圈速,与GPS辅助系统(9.74秒)性能相当,仅比真实值慢0.39秒。
  • 图像平面回归网络的最高平均圈速为14.48秒,比鸟瞰图方法慢4.74秒,主要由于泛化能力差和前瞻能力有限。
  • 鸟瞰图网络将圈速损失降低至真实值的17%,而图像平面网络的损失达29%,表明其性能和鲁棒性更优。
  • 鸟瞰图网络成功预测了相机视场范围之外的可行驶区域,使MPC控制器能够有效规划弯道路径。
  • 系统在高速下(最高达8 m/s)表现出对扰动的鲁棒性,即使接近车辆操控极限也能保持稳定轨迹。
  • 由于成本图具有可解释性,故障案例可被诊断,例如将右转错误识别为左转,该问题在预测图中可直观识别。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。