[论文解读] Map-Adaptive Goal-Based Trajectory Prediction
GoalNet 通过提出基于地图的目标路径并在图网络中建模基于目标和基于运动的模式,实现多模态、长时预测的车辆轨迹。它能适应任意地图几何,在内部数据集和 nuScenes 数据集上优于基线。
We present a new method for multi-modal, long-term vehicle trajectory prediction. Our approach relies on using lane centerlines captured in rich maps of the environment to generate a set of proposed goal paths for each vehicle. Using these paths -- which are generated at run time and therefore dynamically adapt to the scene -- as spatial anchors, we predict a set of goal-based trajectories along with a categorical distribution over the goals. This approach allows us to directly model the goal-directed behavior of traffic actors, which unlocks the potential for more accurate long-term prediction. Our experimental results on both a large-scale internal driving dataset and on the public nuScenes dataset show that our model outperforms state-of-the-art approaches for vehicle trajectory prediction over a 6-second horizon. We also empirically demonstrate that our model is better able to generalize to road scenes from a completely new city than existing methods.
研究动机与目标
- 利用高清地图车道中心线推断 Actor 的目标并实现长 horizon 轨迹预测。
- 开发一个能够通过可变数量的目标处理任意车道拓扑的地图自适应框架。
- 整合基于目标和基于运动的轨迹模式,以捕捉合规与不合规的驾驶行为。
- 采用路径相关坐标系以提升在不同道路几何与场景中的泛化能力。
提出的方法
- 为每个参与者从搜索半径内的车道中心线生成一组可变的目标路径。
- 使用编码器和与路径对齐的栅格对参与者状态、沿途上下文和目标路径进行编码。
- 使用一个包含一个参与者节点和多个目标节点的图网络来预测与每个目标相关联的轨迹。
- 以路径相关的坐标系表示输出,以将沿轨迹与横向分量分离。
- 通过目标驱动和无目标(基于运动)轨迹模式来建模时空多模态性。
- 使用联合损失进行训练,包括对模式的分类损失和对轨迹分量的回归损失。
实验结果
研究问题
- RQ1地图派生的目标路径是否能为每个参与者提供紧凑且可解释的多模态预测?
- RQ2地图自适应的基于集合的预测框架是否能提高长 horizon 的准确性和对新城市的泛化?
- RQ3整合基于目标和基于运动的模式如何影响预测覆盖率和误差指标?
- RQ4路径相关框架对学习和在多样化道路几何中的泛化有何影响?
主要发现
| Method | Dataset | Min1ADE | Min1FDE | Min3ADE | Min3FDE | Min5ADE | Min10ADE | E_ADE |
|---|---|---|---|---|---|---|---|---|
| MTP | internal | 2.67 (2.77) | 7.08 (7.65) | 1.69 (2.10) | 4.36 (5.92) | 1.69 (2.10) | 1.69 (2.10) | 2.98 (2.82) |
| MTP | nuScenes | — | — | — | — | — | — | — |
| MultiPath | internal | 2.91 (4.01) | 7.69 (10.39) | 1.78 (2.40) | 4.61 (6.24) | 1.44 (1.85) | 1.14 (1.35) | 3.33 (4.13) |
| MultiPath | nuScenes | — | — | — | — | — | — | — |
| CoverNet | nuScenes | — | — | — | — | — | — | — |
| GoalNet-1T | internal | 2.27 (2.13) | 5.90 (5.79) | 1.86 (1.77) | 4.70 (4.75) | 1.80 (1.75) | 1.79 (1.75) | 2.35 (2.18) |
| GoalNet-1T | nuScenes | 1.99 (1.46) | — | — | — | — | — | — |
| GoalNet-2T | internal | 2.53 (2.44) | 6.57 (6.63) | 1.53 (1.41) | 3.83 (3.66) | 1.34 (1.27) | 1.28 (1.22) | 2.79 (2.60) |
| GoalNet-2T | nuScenes | — | — | — | — | — | — | — |
- GoalNet 在内部数据集和 nuScenes 数据集的多项指标上达到最先进性能。
- GoalNet-1T(每个空间模式一个时序模式)和 GoalNet-2T(2个时序模式)显示出强劲的结果,GoalNet-2T 在多数指标上常常表现出色。
- 模型使用可变数量的轨迹模式,适应场景几何,减少了对过多固定轨迹集的需求。
- 在较长时域内,横向误差显著降低,凸显了长时间预测的优势。
- 跨城泛化表明 GoalNet 相对于基线在未见城市测试时退化较小,体现了地图自适应的组态化归纳偏置。
- 消融表明路径栅格和路径相关投影对改善 ATE/CTE 和整体预测质量有贡献。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。