[論文レビュー] Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction
ST-ResNet は、外部要因と融合した残差 CNN ブランチを用いて、地域ごとの市全体の流入・流出を同時に予測します。時系列の近接性、周期、トレンドをモデリングします。 北京と NYC のデータで複数のベースラインを上回ります。
Forecasting the flow of crowds is of great importance to traffic management and public safety, yet a very challenging task affected by many complex factors, such as inter-region traffic, events and weather. In this paper, we propose a deep-learning-based approach, called ST-ResNet, to collectively forecast the in-flow and out-flow of crowds in each and every region through a city. We design an end-to-end structure of ST-ResNet based on unique properties of spatio-temporal data. More specifically, we employ the framework of the residual neural networks to model the temporal closeness, period, and trend properties of the crowd traffic, respectively. For each property, we design a branch of residual convolutional units, each of which models the spatial properties of the crowd traffic. ST-ResNet learns to dynamically aggregate the output of the three residual neural networks based on data, assigning different weights to different branches and regions. The aggregation is further combined with external factors, such as weather and day of the week, to predict the final traffic of crowds in each and every region. We evaluate ST-ResNet based on two types of crowd flows in Beijing and NYC, finding that its performance exceeds six well-know methods.
研究の動機と目的
- 交通管理と公共の安全のために、都市全体の正確な群衆フロー予測を動機づける。
- 時空間依存性と外部要因を捉えるエンドツーエンドの深層学習モデルを開発する。
- 時間的近接性・周期・トレンドを、それぞれ専用の残差ネットワークでモデル化する。
- 複数の時系列ブランチと外部データの出力を動的に融合して、全市域のフローを予測する。
提案手法
- 都市を I×J のグリッドに変換し、流入/流出を時間区間ごとに 2 チャンネルの画像のようなテンソルとして表現する。
- 近接性(最近の時刻)、周期(日をまたぐ同じ時刻)、トレンド(長期的パターン)をモデル化するために、3つの残差CNNブランチを用いる。
- パラメトリック行列ベースの融合を適用して、地域別・成分別の出力(近接・周期・トレンド)に重みを付ける。
- 外部要因(天気、祝日、DayOfWeek)を2層の全結合ネットワークで組み込み、時系列出力と融合する。
- 出力を tanh 活性化で [-1,1] に写像して予測し、過去データの平均二乗誤差を最小化するように学習する。
- Adam最適化で学習し、収束を改善するために残差ユニットで BN を使用する。
実験結果
リサーチクエスチョン
- RQ1時空データを用いて、都市全体の群衆の流入/流出を各地域でどのように正確に予測できるか?
- RQ2近接・周期・トレンド用の別個の残差ネットワークは、単一モデルより予測性能を改善するか?
- RQ3外部要因を効果的に統合して予測精度を向上させることができるか?
- RQ4地域と時間を意識した融合メカニズムは、さまざまな市内エリアで性能を向上させるか?
主な発見
| モデル | RMSE |
|---|---|
| HA | 57.69 |
| ARIMA | 22.78 |
| SARIMA | 26.88 |
| VAR | 22.88 |
| ST-ANN | 19.57 |
| DeepST | 18.18 |
| ST-ResNet L2-E | 17.67 |
| ST-ResNet L4-E | 17.51 |
| ST-ResNet L12-E | 16.89 |
| ST-ResNet L12-E-BN | 16.69 |
| ST-ResNet L12-single-E | 17.40 |
| ST-ResNet L12 | 17.00 |
| ST-ResNet L12-E-noFusion | 17.96 |
| BikeNYC ST-ResNet (4 RU) | 6.33 |
| DeepST-C | 8.39 |
| DeepST-CP | 7.64 |
| DeepST-CPT | 7.56 |
| DeepST-CPTM | 7.43 |
- ST-ResNet の派生形は TaxiBJ 北京データで一貫して6つのベースライン(HA、ARIMA、SARIMA、VAR、ST-ANN、DeepST)を上回る。
- TaxiBJ では、最高の ST-ResNet 構成(L12-E-BN)は RMSE 16.69 を達成し、16.89(L12-E)、17.00(融合なしのL12)と比較。
- 外部因子は性能を向上させ、E(外部要因)を含むモデルは含まないモデルよりも優れている(例:L12-E vs L12)。
- パラメトリック行列ベースの融合は、単純な加法融合(L12-E-noFusion)よりはるかに優れている。
- BikeNYC では、4つの残差ユニットを持つ ST-ResNet が RMSE 6.33 を達成し、DeepST 系列を含む全ベースラインを上回る(例:DeepST-CPTM 7.43)。
- このアプローチは、Beijing TaxiBJ と NYC BikeNYC という異なる市データセットに対して良好に一般化する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。