[论文解读] GMAN: A Graph Multi-Attention Network for Traffic Prediction
GMAN 引入一种图形多注意力编码器-解码器模型,具有时空注意力和变换注意力,用于预测道路网络上的多步交通状态,提升长期准确性和容错能力。
Long-term traffic prediction is highly challenging due to the complexity of traffic systems and the constantly changing nature of many impacting factors. In this paper, we focus on the spatio-temporal factors, and propose a graph multi-attention network (GMAN) to predict traffic conditions for time steps ahead at different locations on a road network graph. GMAN adapts an encoder-decoder architecture, where both the encoder and the decoder consist of multiple spatio-temporal attention blocks to model the impact of the spatio-temporal factors on traffic conditions. The encoder encodes the input traffic features and the decoder predicts the output sequence. Between the encoder and the decoder, a transform attention layer is applied to convert the encoded traffic features to generate the sequence representations of future time steps as the input of the decoder. The transform attention mechanism models the direct relationships between historical and future time steps that helps to alleviate the error propagation problem among prediction time steps. Experimental results on two real-world traffic prediction tasks (i.e., traffic volume prediction and traffic speed prediction) demonstrate the superiority of GMAN. In particular, in the 1 hour ahead prediction, GMAN outperforms state-of-the-art methods by up to 4% improvement in MAE measure. The source code is available at https://github.com/zhengchuanpan/GMAN.
研究动机与目标
- 在道路网络的动态时空条件下推动长期交通预测。
- 开发具时空注意力块的编码器-解码器架构,以建模复杂相关性。
- 引入变换注意力层以减轻跨预测步的误差传播。
- 整合时空嵌入以捕捉图结构和时间上下文。
- 在真实世界的交通流量和速度预测数据集上评估 GMAN,并与基线进行比较。
提出的方法
- 在编码器和解码器中使用具有 L 个 ST-Attention 块的编码器-解码器架构。
- 融合时空嵌入(STE),将基于 node2vec 的空间嵌入与时间嵌入结合起来。
- 实现带有空间注意力、时间注意力和门控融合的 ST-Attention 块,用于融合两种信号。
- 在编码器和解码器之间引入变换注意力层,以建模历史步与未来步之间的直接关系。
- 应用分组空间注意力(组内和组间),以降低大图的二次方注意力复杂度。
- 端到端训练,使用 MAE 损失,并使用基于道路网络距离构建的邻接矩阵,带指数稀疏化。
实验结果
研究问题
- RQ1我们如何在更长时间尺度上建模交通数据中的动态空间相关性和非线性时间依赖性?
- RQ2与现有图模型相比,具时空注意力和变换注意力层的编码器-解码器是否能提高长期预测准确性?
- RQ3门控融合的时空信息是否能更好地捕捉交通网络中的复杂时空相关性?
- RQ4GMAN 对缺失或损坏的历史观测在长时域预测中的容错性如何?
主要发现
| 数据 | 方法 | 15 min MAE | 15 min RMSE | 15 min MAPE | 30 min MAE | 30 min RMSE | 30 min MAPE | 1 hour MAE | 1 hour RMSE | 1 hour MAPE |
|---|---|---|---|---|---|---|---|---|---|---|
| Xiamen | ARIMA | 14.81 | 25.03 | 18.05% | 18.83 | 33.09 | 22.19% | 26.58 | 46.32 | 30.76% |
| Xiamen | SVR | 13.05 | 21.47 | 16.46% | 15.66 | 26.34 | 19.68% | 20.69 | 35.86 | 26.24% |
| Xiamen | FNN | 13.55 | 22.47 | 16.72% | 16.80 | 28.71 | 19.97% | 22.90 | 39.51 | 26.19% |
| Xiamen | FC-LSTM | 12.51 | 20.79 | 16.08% | 13.74 | 23.93 | 17.23% | 16.02 | 29.57 | 19.33% |
| Xiamen | STGCN | 11.76 | 19.94 | 14.93% | 13.19 | 23.29 | 16.36% | 15.83 | 29.40 | 18.66% |
| Xiamen | DCRNN | 11.67 | 19.40 | 14.85% | 12.76 | 22.20 | 15.99% | 14.30 | 25.86 | 17.17% |
| Xiamen | Graph WaveNet | 11.26 | 19.57 | 14.39% | 12.06 | 21.61 | 15.39% | 13.33 | 24.77 | 16.50% |
| Xiamen | GMAN | - | - | - | - | - | - | - | - | - |
| PeMS | ARIMA | 1.62 | 3.30 | 3.50% | 2.33 | 4.76 | 5.40% | 3.38 | 6.50 | 8.30% |
| PeMS | SVR | 1.85 | 3.59 | 3.80% | 2.48 | 5.18 | 5.50% | 3.28 | 7.08 | 8.00% |
| PeMS | FNN | 2.20 | 4.42 | 5.19% | 2.30 | 4.63 | 5.43% | 2.46 | 4.98 | 5.89% |
| PeMS | FC-LSTM | 2.05 | 4.19 | 4.80% | 2.20 | 4.55 | 5.20% | 2.37 | 4.96 | 5.70% |
| PeMS | STGCN | 1.36 | 2.96 | 2.90% | 1.81 | 4.27 | 4.17% | 2.49 | 5.69 | 5.79% |
| PeMS | DCRNN | 1.38 | 2.95 | 2.90% | 1.74 | 3.97 | 3.90% | 2.07 | 4.74 | 4.90% |
| PeMS | Graph WaveNet | 1.30 | 2.74 | 2.73% | 1.63 | 3.70 | 3.67% | 1.95 | 4.52 | 4.63% |
| PeMS | GMAN | - | - | - | - | - | - | - | - | - |
- GMAN 在两个真实世界数据集取得最先进的性能(厦门用于交通量,PeMS用于交通速度)。
- 在1小时-ahead预测中,GMAN 相对于基线的 MAE 提升高达4%,并展示出色的长期预测性能。
- GMAN 显示在历史数据部分缺失时相对于基线方法具有更高的容错性。
- 消融研究表明空间注意力、时间注意力、门控融合和变换注意力各自对性能有贡献,其中变换注意力显著缓解了误差传播。
- GMAN 的训练与推理时间相对于 Graph WaveNet 具有竞争力,且比如 DCRNN 这类递归基线更快。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。