[论文解读] AGMA: Adaptive Gaussian Mixture Anchors for Prior-Guided Multimodal Human Trajectory Forecasting
AGMA 通过按批次聚类和全局蒸馏高斯混合锚点来创建具表达力、场景自适应的先验,从而提升多模态轨迹预测的性能,并在多个基准上取得最先进的结果。
Human trajectory forecasting requires capturing the multimodal nature of pedestrian behavior. However, existing approaches suffer from prior misalignment. Their learned or fixed priors often fail to capture the full distribution of plausible futures, limiting both prediction accuracy and diversity. We theoretically establish that prediction error is lower-bounded by prior quality, making prior modeling a key performance bottleneck. Guided by this insight, we propose AGMA (Adaptive Gaussian Mixture Anchors), which constructs expressive priors through two stages: extracting diverse behavioral patterns from training data and distilling them into a scene-adaptive global prior for inference. Extensive experiments on ETH-UCY, Stanford Drone, and JRDB datasets demonstrate that AGMA achieves state-of-the-art performance, confirming the critical role of high-quality priors in trajectory forecasting.
研究动机与目标
- 强调高质量先验在多模态轨迹预测中的重要性。
- 提出一个两阶段框架来显式优化先验:批量先验提取和全局先验蒸馏。
- 证明改善先验质量可以降低预测误差并改善分布匹配。
- 在 ETH-UCY、Stanford Drone 和 JRDB 数据集上展示最先进的性能。
提出的方法
- 将先验表述为自适应高斯混合锚点(GMMs)。
- 阶段1:通过图结构聚类的批量先验提取,在每个训练批次内发现多样化行为模式并将其编码为批量级GMM。
- 阶段2:使用最优传输通过跨注意力将批量GMM映射到上下文条件的全局GMM进行全局先验蒸馏。
- 使用一个简单的共享MLP解码器来展示先验质量—而非解码器复杂度—驱动性能。
- 以强调聚类质量的损失(L_B)、对引导的直接监督(L_G)和蒸馏对齐(L_distill)的损失进行训练。
- 测试时采样使用上下文条件的全局先验并结合跨注意力来生成多样化的预测。

实验结果
研究问题
- RQ1直接提高先验质量是否能提升轨迹预测准确性和分布匹配?
- RQ2通过批量聚类和全局蒸馏的显式先验优化能否缓解先验错配并获得更好的多模态预测?
- RQ3AGMA 如何在与简单解码器的兼容性下平衡先验学习以展示先验的威力?
主要发现
- AGMA 在 ETH-UCY 上的表现与使用复杂解码器的方法相比具有竞争力,甚至达到最先进水平。
- 在 ETH-UCY 上,AGMA 在 mADE 20 上提高了 5.26%,在 mFDE 20 上提高了 9.38%。
- 在 ETH-UCY、SDD 和 JRDB 中,AGMA 显示出一致的增益,验证了高质量先验的优先性。
- 消融实验表明去除 L_G 导致最大的性能下降,凸显直接监督全局先验的必要性。
- 批量大小的影响表明更细的批次划分能更好地捕捉局部先验,防止全局分布过平滑。
- 增大 Top-K 采样仍然提升性能,表明学习到的先验编码了有意义的多样化模式并防止模式坍缩。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。