[论文解读] MotionCNN: A Strong Baseline for Motion Prediction in Autonomous Driving
MotionCNN 提供了一个简单的基于 CNN 的基线,输出多种带有置信度的未来轨迹假设,在 Waymo Open Motion Dataset 上取得有竞争力的结果,并在 2021 年挑战中排名第三。
To plan a safe and efficient route, an autonomous vehicle should anticipate future motions of other agents around it. Motion prediction is an extremely challenging task that recently gained significant attention within the research community. In this work, we present a simple and yet very strong baseline for multimodal motion prediction based purely on Convolutional Neural Networks. While being easy-to-implement, the proposed approach achieves competitive performance compared to the state-of-the-art methods and ranks 3rd on the 2021 Waymo Open Dataset Motion Prediction Challenge. Our source code is publicly available at GitHub
研究动机与目标
- 在不使用复杂架构的前提下,提出一个简单而强大的多模态运动预测基线。
- 利用光栅化的鸟瞰视图表示和 CNN 来预测多条带置信度的未来轨迹。
- 展示在 Waymo Open Motion Dataset 上与前沿方法相比的竞争性表现。
提出的方法
- 将历史轨迹和地图光栅化为以目标智能体为中心的多通道 224x224 图像。
- 使用一个 CNN 骨干网络(在 ImageNet 上预训练)通过混合模型预测 K 条轨迹假设及其置信度。
- 将未来建模为固定协方差的 K 个高斯分布的混合;使用对真实轨迹的负对数似然损失进行训练。
- 推理阶段,输出 K=6 条轨迹假设,并将它们的均值作为最终预测,附带置信度。
- 使用 AdamW、带热启动的余弦退火以及早停进行训练;评估骨干网络变体(Xception71、ResNet18)。
- 将光栅化结果缓存到磁盘以通过避免在线光栅化来加速训练。
实验结果
研究问题
- RQ1纯粹基于 CNN 的光栅图像方法是否能够匹敌使用图结构或复杂架构的最先进运动预测方法?
- RQ2使用简单的高斯混合损失结合 CNN 回归是否能提供有意义的多模态轨迹预测?
- RQ3在此基线中,轻量级骨干网络(如 ResNet18)与较深的骨干网络(如 Xception71)相比如何?
主要发现
| 方法 | mAP | 最小 ADE | 最小 FDE | 漏判率 | 重叠率 |
|---|---|---|---|---|---|
| Waymo LSTM baseline | 0.1756 | 1.0065 | 2.3553 | 0.3750 | 0.1898 |
| ReCoAt | 0.2711 | 0.7703 | 1.6668 | 0.2437 | 0.1642 |
| DenseTNT | 0.3281 | 1.0387 | 1.5514 | 0.1573 | 0.1779 |
| MotionCNN-Xception71 (Ours) | 0.2136 | 0.7400 | 1.4936 | 0.2091 | 0.1560 |
| MotionCNN-ResNet18 (Ours) | 0.1920 | 0.8154 | 1.6396 | 0.2552 | 0.1605 |
| MotionCNN-Xception71 (Ours) | 0.2123 | 0.7383 | 1.4957 | 0.2072 | 0.1576 |
- MotionCNN 基线在 Waymo Open Motion Dataset 的运动预测挑战中使用 mAP 指标排名第3。
- 在 Min ADE 和 Min FDE 指标上达到具有竞争力的分数,在这些指标上超越了若干更复杂的模型。
- 在 Xception71 骨干下,MotionCNN 在测试集上达到 mAP 0.2136、Min ADE 0.7400、Min FDE 1.4936、Miss Rate 0.2091、Overlap Rate 0.1560。
- ResNet18 变体的训练速度大约快三倍,但性能低于更深的骨干。
- 在验证集上,MotionCNN-Xception71 达到 mAP 0.2123、Min ADE 0.7383、Min FDE 1.4957、Miss Rate 0.2072、Overlap Rate 0.1576。
- 该模型输出 6 条轨迹假设(K=6),对应挑战中评估的预测集合大小。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。