[论文解读] Social Attention for Autonomous Decision-Making in Dense Traffic
本文提出一种基于注意力的策略架构,能够处理邻近车辆数量可变和排列不变性,以在密集交通中改善自动驾驶决策,并具有可解释的注意力模式。
We study the design of learning architectures for behavioural planning in a dense traffic setting. Such architectures should deal with a varying number of nearby vehicles, be invariant to the ordering chosen to describe them, while staying accurate and compact. We observe that the two most popular representations in the literature do not fit these criteria, and perform badly on an complex negotiation task. We propose an attention-based architecture that satisfies all these properties and explicitly accounts for the existing interactions between the traffic participants. We show that this architecture leads to significant performance gains, and is able to capture interactions patterns that can be visualised and qualitatively interpreted. Videos and code are available at https://eleurent.github.io/social-attention/.
研究动机与目标
- 为密集交通中的自主驾驶提供基于学习的行为规划的动机。
- 批评常见的状态表示(特征列表与空间网格)在可变输入大小和排列不变性方面的局限。
- 引入一个基于注意力的架构,捕捉自车与多辆近邻车辆之间的交互。
- 在包含多达15辆车的复杂交叉口穿越任务中,展示性能提升与可解释性。
- 展示注意力模式与直观的安全性与协商动态相吻合。
提出的方法
- 采用带有专门 Q 函数架构的 DQN 框架。
- 用共享线性编码器对每个周围车辆进行编码。
- 应用带多头的自车注意力层以计算与自车的交互。
- 使用残差连接将注意力输出聚合到自车编码。
- 使用线性解码器产生高级决策的动作值。
- 演示排列不变性和无填充的可变输入大小。
实验结果
研究问题
- RQ1基于注意力的社会交互能否在密集交通中优于固定大小表示的决策?
- RQ2以自车为中心的多头注意力是否捕捉到有意义的车对自车的依赖并具备可解释性?
- RQ3在交叉口场景中,与基于列表和基于网格的表示相比,所提方法在性能和安全性方面的比较如何?
- RQ4该模型是否能够利用交互模式并根据路权优先级表现得更具攻击性或更克制?
- RQ5该方法是否可扩展到车辆数量更多、配置多样的场景?
主要发现
- 一个自车注意力架构在性能上显著优于 FCN/List 和 CNN/Grid 基线。
- 该模型处理不同数量的车辆并保持排列不变性,从而提高交叉口穿越的决策质量。
- 注意力头对不同区域(如左侧和前方/右侧)进行专门化,并更关注可能发生碰撞的车辆,目标越近,注意力越集中。
- 策略学会对交通优先权进行细致协商,并可根据路权优先级进行调整,从而影响攻击性。
- 定性可视化显示了在回合中可解释的交互模式和注意力动态。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。