[论文解读] Do We Really Need Graph Neural Networks for Traffic Forecasting?
本文提出 SimST,一种无需图结构的时空学习方法,通过局部邻近建模和全局传感器嵌入来近似 GNN 的洞察,在精度上可与 STGNNs 相当,同时具备更高的吞吐量。
Spatio-temporal graph neural networks (STGNN) have become the most popular solution to traffic forecasting. While successful, they rely on the message passing scheme of GNNs to establish spatial dependencies between nodes, and thus inevitably inherit GNNs' notorious inefficiency. Given these facts, in this paper, we propose an embarrassingly simple yet remarkably effective spatio-temporal learning approach, entitled SimST. Specifically, SimST approximates the efficacies of GNNs by two spatial learning techniques, which respectively model local and global spatial correlations. Moreover, SimST can be used alongside various temporal models and involves a tailored training strategy. We conduct experiments on five traffic benchmarks to assess the capability of SimST in terms of efficiency and effectiveness. Empirical results show that SimST improves the prediction throughput by up to 39 times compared to more sophisticated STGNNs while attaining comparable performance, which indicates that GNNs are not the only option for spatial modeling in traffic forecasting.
研究动机与目标
- 通过将空间建模简化为简单、可扩展的组件,质疑在交通预测中使用图神经网络的必要性。
- 提出两种空间学习模块,在不进行信息传递的情况下近似 GNN 的效用:局部邻近建模和全局相关性学习。
- 展示与多种时序编码器的即插即用兼容性,以及提升泛化能力的训练策略。
- 在五个交通基准数据集上评估相对于最先进 STGNN 基线的效率与准确性。
提出的方法
- 引入两种取代 GNN 信息传递的空间模块:(1) 局部邻近建模使用自我图和一个 MLP,处理节点及其前后顶 k 个一跳邻居的历史数据;(2) 全局相关性学习使用通过 MLP 转换的静态传感器嵌入来建模远程空间关系。
- 在端到端框架中将空间模块与多种时序编码器(GRU、WaveNet、因果 Transformer)结合;将时序摘要与位置信息嵌入连接后通过 MLP 进行预测。
- 采用基于节点的批采样策略以提升泛化并降低内存占用,将每个节点-时间窗视为一个独立样本以增加样本多样性。
- 给出复杂度分析,显示所提空间模块的线性扩展性相对于具有自适应邻接的典型 STGNN 的二次扩展性。
- 进行消融研究和案例分析,以量化相关性学习、邻近建模和训练策略的贡献。
实验结果
研究问题
- RQ1交通预测中的时空依赖是否可以在无需基于 GNN 的消息传递的情况下被有效建模?
- RQ2简单的局部和全局空间模块是否足以匹配甚至超过 STGNNs 的性能,同时提供更高的推理吞吐量?
- RQ3所提出的训练策略(基于节点的采样)如何影响泛化性和效率?
- RQ4所提出的空间模块是否在不同的时序骨干网络(GRU、WaveNet、Transformer)和数据集上具有鲁棒性?
主要发现
- SimST 变体在五个交通基准数据集上的准确度与最先进的 STGNNs 相当。
- SimST 的推理吞吐量比基线高出最多 39 倍,同时保持可比的性能。
- 全局传感器嵌入和局部自我图建模对性能贡献显著,在邻居信息稀少时,全局模块尤其关键。
- 基于节点的批采样改善泛化并降低内存成本,使大图扩展成为可能。
- Transformers 并非总是更优;基于 GRU 的 SimST 变体表现强劲,凸显了简单双边空间设计的有效性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。