[论文解读] Spatially-Aware Graph Neural Networks for Relational Behavior Forecasting from Sensor Data
SpAGNN 引入了一种具空间感知的图神经网络,通过对检测到的代理之间的交互建模,联合执行对象检测与概率性、关系型运动预测,用于自动驾驶。它在 ATG4D 和 nuScenes 上取得了最先进的结果。
In this paper, we tackle the problem of relational behavior forecasting from sensor data. Towards this goal, we propose a novel spatially-aware graph neural network (SpAGNN) that models the interactions between agents in the scene. Specifically, we exploit a convolutional neural network to detect the actors and compute their initial states. A graph neural network then iteratively updates the actor states via a message passing process. Inspired by Gaussian belief propagation, we design the messages to be spatially-transformed parameters of the output distributions from neighboring agents. Our model is fully differentiable, thus enabling end-to-end training. Importantly, our probabilistic predictions can model uncertainty at the trajectory level. We demonstrate the effectiveness of our approach by achieving significant improvements over the state-of-the-art on two real-world self-driving datasets: ATG4D and nuScenes.
研究动机与目标
- 通过对代理之间的交互进行建模,激励并解决自动驾驶中的关系型行为预测。
- 开发一个可联合训练的模型,结合感知(检测)与社交预测(轨迹预测)。
- 利用受高斯信念传播启发的具空间感知的GNN,以捕获多代理交互。
- 生成在轨迹层面对不确定性进行量化的概率轨迹预测。
提出的方法
- 双阶段架构:来自激光雷达和高分辨率地图的输入用于对象检测,以及对每个参与者进行基于 RoI 的特征提取。
- 一个全连接的有向交互图,其中每个检测到的参与者都是一个节点。"
- 具空间感知的图神经网络(SpAGNN)展开消息传递;消息通过空间坐标变换以与相邻帧对齐。
- 每个参与者输出分布:x,y 轨迹为高斯分布,航向为 Von Mises 分布,参数通过 GNN 消息传递更新。
- 端到端训练,具有多任务目标,包括检测损失(分类和框回归)以及轨迹预测的负对数似然损失。
实验结果
研究问题
- RQ1如何有效建模多代理交互以同时提升检测和关系型运动预测在自动驾驶中的表现?
- RQ2利用局部坐标变换的具空间感知GNN是否能在概率轨迹预测和社会遵从性方面优于基线?
- RQ3端到端训练能否在联合检测-预测框架中减轻从感知到预测的误差传播?
- RQ4使用 RoI 对齐的参与者特征和空间变换对预测准确性和不确定性建模有何影响?
主要发现
- SpAGNN 在 ATG4D 和 nuScenes 上相较于最先进的基线,提升了检测和面向交互的预测。
- 结合空间变换的消息和局部坐标系可降低碰撞率,并在多个视界下改善质心的 L2 和航向误差。
- 基于旋转 RoI Align 的逐参与者特征优于简单的 RoI 特征索引。
- 具空间感知(全局/全局相对坐标中的边界框)及分布输出(高斯+Von Mises)有助于降低预测熵并提高预测准确性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。