Skip to main content
QUICK REVIEW

[论文解读] TURBO: Utility-Aware Bandwidth Allocation for Cloud-Augmented Autonomous Control

Schafhalter, Peter, Krentsel, Alexander|arXiv (Cornell University)|Jan 1, 2026
Autonomous Vehicle Technology and Safety被引用 13
一句话总结

本文提出 ChauffeurNet,一种用于自动驾驶的深度学习模型,通过在专家演示中引入合成扰动(如碰撞和偏离道路行驶)并添加辅助损失来惩罚不良行为、鼓励前进,从而改进模仿学习。该方法仅使用离线数据即可在真实世界条件下实现鲁棒的闭环驾驶,在复杂城市场景中实现安全稳定的性能,且无需强化学习。

ABSTRACT

Autonomous driving system progress has been driven by improvements in machine learning (ML) models, whose computational demands now exceed what edge devices alone can provide. The cloud offers abundant compute, but the network has long been treated as an unreliable bottleneck rather than a co-equal part of the autonomous vehicle control loop. We argue that this separation is no longer tenable: safety-critical autonomy requires co-design of control, models, and network resource allocation itself. We introduce TURBO, a cloud-augmented control framework that addresses this challenge, formulating bandwidth allocation and control pipeline configuration across both the car and cloud as a joint optimization problem. TURBO maximizes benefit to the car while guaranteeing safety in the face of highly variable network conditions. We implement TURBO and evaluate it in both simulation and real-world deployment, showing it can improve average accuracy by up to 15.6%pt over existing on-vehicle-only pipelines. Our code is made available at www.github.com/NetSys/turbo.

研究动机与目标

  • 开发一种在真实世界自动驾驶中具有鲁棒性的模仿学习策略,使其能够超越专家演示的泛化能力。
  • 解决纯行为克隆在复杂驾驶场景(如狭窄街道和停靠车辆)中失效的问题。
  • 通过在训练期间模拟罕见且危险的场景,减少对强化学习或主动数据采集的依赖。
  • 利用中层感知与控制表征实现安全的闭环驾驶,支持仿真到现实的迁移。
  • 在仿真环境和真实世界部署中验证该模型在量产自动驾驶汽车上的性能。

提出的方法

  • 该模型使用环境的自上而下、中层表征,包括道路布局、交通灯以及周围车辆的定向2D框。
  • 一个循环神经网络(RNN),即 ChauffeurNet,处理该表征,以概率分布形式预测未来的可行驶轨迹。
  • 训练损失通过辅助项进行增强,以惩罚碰撞、偏离道路和缺乏前进,同时鼓励轨迹保持。
  • 通过修改专家轨迹生成合成扰动,创建非专家行为(如碰撞和车道偏离),用于训练模型避免此类行为。
  • 该模型在真实世界专家数据与模拟扰动轨迹的混合数据上进行训练,实现在不收集危险真实世界样本的情况下进行数据增强。
  • 在推理阶段,模型可从预测的概率分布中采样,以生成多样的速度配置,或强制执行硬性约束(如限速)。

实验结果

研究问题

  • RQ1仅靠模仿学习能否产生一种鲁棒的驾驶策略,实现在真实世界驾驶中的安全闭环操作?
  • RQ2在不收集新专家数据的情况下,如何提升行为克隆模型在专家演示之外的泛化能力?
  • RQ3辅助损失和合成数据扰动在提升模型对罕见或危险驾驶场景鲁棒性方面发挥什么作用?
  • RQ4中层表征在多大程度上能够实现自动驾驶中有效的仿真到现实迁移?
  • RQ5仅使用离线数据训练的模型能否在不使用强化学习的情况下,成功应对复杂城市场景(如转弯、停车标志和交通灯)?

主要发现

  • 同时使用数据增强(合成扰动)和损失增强(惩罚碰撞和偏离道路)的模型,在闭环仿真和真实世界驾驶中显著优于纯行为克隆。
  • 在开环评估中,完整模型(M4)的轨迹误差高于基线(M0),但在闭环测试中,M4表现出稳定且安全的驾驶,表明开环指标可能具有误导性。
  • 消融研究证实,数据增强和损失增强均至关重要:缺乏合成扰动的模型在偏离后无法恢复,导致偏离道路。
  • 该模型成功在真实 Waymo 车辆上实现了长时间的全闭环控制驾驶,能够处理转弯、停车标志、交通灯和动态交通参与者。
  • 尽管取得成功,该模型在罕见或复杂操作(如U型转弯、死胡同和高速汇入)中仍表现不佳,表明当前数据覆盖存在局限,需进一步探索。
  • 概率轨迹预测的使用实现了对硬性约束(如限速)的受控采样,展示了将安全规则直接集成到推理过程的潜力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。