[论文解读] Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction
DMVST-Net 联合建模空间、时间和语义关系以预测出租车需求,在广州的大规模数据上优于最先进基线。
Taxi demand prediction is an important building block to enabling intelligent transportation systems in a smart city. An accurate prediction model can help the city pre-allocate resources to meet travel demand and to reduce empty taxis on streets which waste energy and worsen the traffic congestion. With the increasing popularity of taxi requesting services such as Uber and Didi Chuxing (in China), we are able to collect large-scale taxi demand data continuously. How to utilize such big data to improve the demand prediction is an interesting and critical real-world problem. Traditional demand prediction methods mostly rely on time series forecasting techniques, which fail to model the complex non-linear spatial and temporal relations. Recent advances in deep learning have shown superior performance on traditionally challenging tasks such as image classification by learning the complex features and correlations from large-scale data. This breakthrough has inspired researchers to explore deep learning techniques on traffic prediction problems. However, existing methods on traffic prediction have only considered spatial relation (e.g., using CNN) or temporal relation (e.g., using LSTM) independently. We propose a Deep Multi-View Spatial-Temporal Network (DMVST-Net) framework to model both spatial and temporal relations. Specifically, our proposed model consists of three views: temporal view (modeling correlations between future demand values with near time points via LSTM), spatial view (modeling local spatial correlation via local CNN), and semantic view (modeling correlations among regions sharing similar temporal patterns). Experiments on large-scale real taxi demand data demonstrate effectiveness of our approach over state-of-the-art methods.
研究动机与目标
- 推动准确的出租车需求预测以优化资源配置并减少智能城市中的空车。
- 提出一个统一框架,整合空间、时间和语义相关性用于需求预测。
- 利用局部空间建模、序列时间动态和语义区域相似性来提升预测。
提出的方法
- 三视 DMVST-Net 框架,结合用于近区域空间依赖的本地 CNN、用于时间序列建模的 LSTM,以及用于区域相似性的语义图嵌入。
- 本地 CNN 在中心化的 SxS 邻域图像上运行,以通过跨区域共享参数来捕捉局部空间模式。
- 时间视图使用 LSTM 来建模序列需求,将上下文特征拼接为输入。
- 语义视图利用周需求模式的动态时间规整构建区域相似性图,使用 LINE 对节点进行嵌入,并将嵌入整合到预测中。
- 最终预测通过全连接网络将 LSTM 输出与语义嵌入结合,输出以 sigmoid 结束,随后反归一化回实际需求值。
- 损失包含均方误差(MSE)和加权平方相对误差(MAPE 组件)以在大值和相对精度之间取得平衡。
实验结果
研究问题
- RQ1能否用一个统一的深度框架捕捉出租车需求预测中的本地空间、时间和语义区域相关性?
- RQ2在局部空间和时间模型之外,融入远距离区域的语义相似性是否能改善预测?
- RQ3变体(仅时间、含空间、含语义、含本地 CNN)在预测准确性上如何比较?
- RQ4DMVST-Net 在一周中各天的鲁棒性特征及不同 LSTM 序列长度的表现如何?
主要发现
| 方法 | MAPE | RMSE |
|---|---|---|
| 历史平均值 | 0.2513 | 12.167 |
| ARIMA | 0.2215 | 11.932 |
| 普通最小二乘回归 | 0.2063 | 10.234 |
| Ridge 回归 | 0.2061 | 10.224 |
| Lasso | 0.2091 | 10.327 |
| 多层感知机 | 0.1840 | 10.609 |
| XGBoost | 0.1953 | 10.012 |
| ST-ResNet | 0.1971 | 10.298 |
| DMVST-Net | 0.1616 | 9.642 |
- DMVST-Net 在总体上取得最佳性能,MAPE 0.1616,RMSE 9.642,超越所有基线。
- 基线方法包括 HA、ARIMA、OLSR、Ridge、Lasso、MLP、XGBoost 和 ST-ResNet;相对于最佳基线,DMVST-Net 将 MAPE 降低 12.17%,RMSE 降低 3.70%。
- 消融研究显示 时间+语义 与 时间+局部空间 变体相较于仅时间有所提升;完整多视图模型取得最佳结果(MAPE 0.1616,RMSE 9.642)。
- 本地 CNN (LCNN) 优于简单的邻域聚合方法,凸显了非线性局部空间建模的价值。
- 通过区域嵌入的语义视图提供额外增益,与时间视图结合时进一步降低 MAPE。
- DMVST-Net 在一周内的鲁棒性表现良好,周末预测更具挑战性,但 DMVST-Net 显示周末与工作日误差增幅最小。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。