QUICK REVIEW

[论文解读] Joint Interaction and Trajectory Prediction for Autonomous Driving using Graph Neural Networks

Donsuk Lee, Yiming Gu|arXiv (Cornell University)|Dec 17, 2019

Autonomous Vehicle Technology and Safety参考文献 24被引用 30

一句话总结

本文提出一种图神经网络，联合预测交通场景中车辆的轨迹和离散交互模式（如让行或优先通过），利用弱监督标注函数从未来轨迹中生成交互标签。该模型通过显式建模成对交互意图，实现了最先进的轨迹预测精度，在大规模真实数据集上达到1.579米的平均位移误差，且无需人工标注标签即可学习语义上合理的交互模式。

ABSTRACT

In this work, we aim to predict the future motion of vehicles in a traffic scene by explicitly modeling their pairwise interactions. Specifically, we propose a graph neural network that jointly predicts the discrete interaction modes and 5-second future trajectories for all agents in the scene. Our model infers an interaction graph whose nodes are agents and whose edges capture the long-term interaction intents among the agents. In order to train the model to recognize known modes of interaction, we introduce an auto-labeling function to generate ground truth interaction labels. Using a large-scale real-world driving dataset, we demonstrate that jointly predicting the trajectories along with the explicit interaction types leads to significantly lower trajectory error than baseline methods. Finally, we show through simulation studies that the learned interaction modes are semantically meaningful.

研究动机与目标

通过显式建模车辆、行人及其他智能体之间的交互，提升自动驾驶中的轨迹预测性能。
开发一种基于图神经网络的方法，联合预测未来轨迹与离散交互类型（如让行、优先通过）。
通过引入基于启发式规则的自动标注函数，减少对昂贵人工标注交互标签的依赖。
评估建模交互类型是否能提升复杂交通场景中轨迹预测的准确率与可解释性。
通过仿真与消融实验，证明所学习的交互模式具有语义上的合理性。

提出的方法

构建图神经网络，其中节点表示智能体，边表示它们之间的成对交互意图，边特征通过消息传递机制学习。
模型通过多头预测头联合预测未来轨迹与离散交互类型，轨迹与交互分类分别使用独立的损失组件。
自动标注函数基于启发式规则从未来轨迹数据中生成交互标签：例如，若一个智能体停止而另一个继续前进，则前者被标注为“让行”。
交互类型被建模为离散变量（如“让行”、“优先通过”、“无视”），图结构根据智能体间的距离与相对运动动态更新。
模型通过MSE损失（用于轨迹预测）与交叉熵损失（用于交互类型分类）的加权组合进行训练，超参数α控制损失平衡。
消融实验对比了监督与无监督交互学习方法，并评估了在图中包含或排除特定边类型（如“无视”边）的影响。

实验结果

研究问题

RQ1与忽略交互的模型相比，联合预测轨迹与离散交互类型是否能提升轨迹预测准确率？
RQ2将交互建模为离散、可解释的变量，是否能带来更语义合理且可解释的自动驾驶系统行为？
RQ3基于启发式规则的自动标注函数在无人工标注的情况下，生成可靠交互标签的有效性如何？
RQ4在模型中引入“无视”交互边对性能与可解释性有何影响？
RQ5在使用弱标签数据时，无监督交互学习是否优于监督学习？

主要发现

联合预测模型的平均位移误差（DPE）为1.579米，显著优于基线RNN模型（2.051米）及其他所有变体。
采用无监督交互学习的模型（DPE为1.579米）略优于监督版本（DPE为1.611米），表明自动标注函数仍有优化空间。
在图中包含“无视”边可提升性能，表明建模非交互行为对轨迹预测有益。
使用真实交互类型标签的“理想模型”（oracle model）表现最佳（DPE为1.638米），证实交互建模可提升轨迹预测精度。
尽管未使用地图特征，该模型在沿轨道误差上与基于地图和场景上下文感知的模型[11]表现相当（0.477米 vs. 0.334米）。
仿真研究证实，预测的交互模式具有语义合理性，其轨迹与预期交互行为一致（如让行或优先通过）。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。