QUICK REVIEW

[论文解读] Deep Imitation Learning for Autonomous Driving in Generic Urban Scenarios with Enhanced Safety

Jianyu Chen, Bodi Yuan|arXiv (Cornell University)|Mar 2, 2019

Autonomous Vehicle Technology and Safety参考文献 27被引用 32

一句话总结

本论文提出一种用于城市驾驶的深度模仿学习框架，使用鸟瞰输入预测未来轨迹，并结合基于安全集理论的安全控制器，以确保在仿真中的测试阶段安全运行。

ABSTRACT

The decision and planning system for autonomous driving in urban environments is hard to design. Most current methods manually design the driving policy, which can be expensive to develop and maintain at scale. Instead, with imitation learning we only need to collect data and the computer will learn and improve the driving policy automatically. However, existing imitation learning methods for autonomous driving are hardly performing well for complex urban scenarios. Moreover, the safety is not guaranteed when we use a deep neural network policy. In this paper, we proposed a framework to learn the driving policy in urban scenarios efficiently given offline connected driving data, with a safety controller incorporated to guarantee safety at test time. The experiments show that our method can achieve high performance in realistic simulations of urban driving scenarios.

研究动机与目标

在没有手工策略的前提下，推动城市自动驾驶的决策与规划学习。
提出鸟瞰观测表示，以提高样本效率和泛化能力。
学习深度策略，从离线专家数据预测计划轨迹。
结合安全控制器以在测试时保证安全，同时不需要预测未来的障碍物运动。

提出的方法

使用一个鸟瞰输入，编码高精度地图（HD map）、路线、交通信号、过去的对象，以及过去的自车状态。
输出一个在时间步长 horizon H 内的计划轨迹，而不是直接的控制指令。
训练一个卷积神经网络（类似 VGG）将鸟瞰输入映射到轨迹点，并采用基于位移的损失。
通过在数据收集阶段引入噪声来扩充数据，以降低协变量偏移。
结合基于安全集合理论的安全控制器，通过二次规划将规划器输出投射到安全控制集合中。

实验结果

研究问题

RQ1离线城市驾驶数据的模仿学习是否能在通用城市场景中获得高性能策略？
RQ2鸟瞰表示是否降低样本复杂度并在城市布局之间提高泛化能力？
RQ3是否将安全控制器纳入其中即可在测试时保证安全，而不需要预测障碍物轨迹？
RQ4数据增强如何影响闭环性能以及对扰动的恢复能力？

主要发现

最终模型结合数据增强和安全控制器，在交叉口和环岛试验中达到近乎完美的成功率（交叉口：100%；环岛：96%）。
相较于非增强基线，开环位移误差随着增强和安全组件的引入而改善（例如，在新城镇数据集中基模型为 0.16 m 而非 0.44 m）。
安全控制器保证更安全的行为，降低违规行为（偏离车道和碰撞）相较于 Town03 和 Town01 的其他学习方法。
数据增强显著提升在异常状态下的恢复能力并增强在复杂城市场景中的策略鲁棒性。
该方法在闭环 CARLA 实验中表现与模块化流水线及其他学习方法相当或更优。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。