[论文解读] Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting
本文提出 DCRNN,一种扩散卷积循环网络,通过在有向图上扩散来建模时空交通,从而在长期预测方面优于基线。
Spatiotemporal forecasting has various applications in neuroscience, climate and transportation domain. Traffic forecasting is one canonical example of such learning task. The task is challenging due to (1) complex spatial dependency on road networks, (2) non-linear temporal dynamics with changing road conditions and (3) inherent difficulty of long-term forecasting. To address these challenges, we propose to model the traffic flow as a diffusion process on a directed graph and introduce Diffusion Convolutional Recurrent Neural Network (DCRNN), a deep learning framework for traffic forecasting that incorporates both spatial and temporal dependency in the traffic flow. Specifically, DCRNN captures the spatial dependency using bidirectional random walks on the graph, and the temporal dependency using the encoder-decoder architecture with scheduled sampling. We evaluate the framework on two real-world large scale road network traffic datasets and observe consistent improvement of 12% - 15% over state-of-the-art baselines.
研究动机与目标
- 将道路网络上的交通速度预测建模为有向图上的时空问题。
- 通过图结构上的扩散卷积捕捉空间依赖。
- 使用适配扩散卷积的循环单元建模时间动态。
- 通过编码器-解码器结构与计划采样提升长期预测。
- 在大规模真实数据集上进行实证验证,显示相对于基线的性能提升。
提出的方法
- 将交通传感器表示为带权有向图,并通过带重启的随机游走来建模扩散以定义扩散卷积。
- 定义一个扩散卷积算子,将前向和反向扩散步骤与可训练权重结合(K-step 截断)。
- 实现一个扩散卷积层,使用扩散滤波器将输入特征映射到输出。
- 用扩散卷积替换标准GRU/矩阵乘法,形成 DCGRU 用于时空建模。
- 使用带计划采样的编码器-解码器序列到序列框架以改善长期预测。
- 端到端训练以最大化真实世界数据集未来时间序列的似然。
实验结果
研究问题
- RQ1有向道路图上的扩散过程如何捕捉交通信号的空间依赖?
- RQ2将基于扩散的时空建模与时间递归结合是否提升短期和长期交通预测?
- RQ3双向扩散相对于单向扩散对预测精度有何影响?
- RQ4具有计划采样的编码器-解码器是否能减小多步预测中的误差传播?
- RQ5在现实交通网络中,DCRNN 与谱方法/无向图方法相比如何?
主要发现
- DCRNN 在 METR-LA 与 PEMS-BAY 数据集的 15 分钟、30 分钟和 1 小时预测范围超越了最先进基线。
- 双向扩散(前向与反向)在预测精度上优于单向扩散。
- 引入扩散卷积显著降低相比于没有空间卷积的模型的验证误差。
- 具有计划采样的编码器-解码器降低多步预测中的误差传播。
- 随着预测时长的增加,DCRNN及其变体表现更强,在像 METR-LA 这样的挑战性数据集上获得显著提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。