Skip to main content
QUICK REVIEW

[논문 리뷰] Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction

Junbo Zhang, Yu Zheng|arXiv (Cornell University)|2016. 10. 01.
Traffic Prediction and Management Techniques참고 문헌 14인용 수 205
한 줄 요약

ST-ResNet은 잔차 CNN 가지를 통해 시간적 근접성, 주기 및 추세를 모델링하고 외부 요인과 융합하여 지역별로 도시 전체의 유입 및 유출을 함께 예측합니다. 베이징과 NYC 데이터에서 여러 벤치마크를 능가합니다.

ABSTRACT

Forecasting the flow of crowds is of great importance to traffic management and public safety, yet a very challenging task affected by many complex factors, such as inter-region traffic, events and weather. In this paper, we propose a deep-learning-based approach, called ST-ResNet, to collectively forecast the in-flow and out-flow of crowds in each and every region through a city. We design an end-to-end structure of ST-ResNet based on unique properties of spatio-temporal data. More specifically, we employ the framework of the residual neural networks to model the temporal closeness, period, and trend properties of the crowd traffic, respectively. For each property, we design a branch of residual convolutional units, each of which models the spatial properties of the crowd traffic. ST-ResNet learns to dynamically aggregate the output of the three residual neural networks based on data, assigning different weights to different branches and regions. The aggregation is further combined with external factors, such as weather and day of the week, to predict the final traffic of crowds in each and every region. We evaluate ST-ResNet based on two types of crowd flows in Beijing and NYC, finding that its performance exceeds six well-know methods.

연구 동기 및 목표

  • 교통 관리와 공공 안전을 위한 도시 전체 군중 흐름 예측의 정확성을 촉진한다.
  • 공간-시간 의존성과 외부 요인을 포착하는 엔드투엔드(deep) 학습 모델을 개발한다.
  • 시간적 근접성, 주기 및 추세를 전용 잔차 네트워크로 모델링한다.
  • 도시의 모든 구역에서 흐름을 예측하기 위해 다중 시간 가지와 외부 데이터를 동적으로 융합한다.

제안 방법

  • 도시를 I x J 격자로 변환하고 매 시간 간격마다 유입/유출을 2채널 이미지 형태의 텐서로 표현한다.
  • 근접성(최근 시간), 기간(다음 날 같은 시간), 추세(장기 패턴)를 모델링하기 위해 세 개의 잔차-CNN 가지를 사용한다.
  • 지역 및 구성요소별 출력(근접성, 기간, 추세)을 가중하기 위해 파라메트릭 행렬 기반 융합을 적용한다.
  • 외부 요인(날씨, 휴일, DayOfWeek)을 두 층의 완전 연결 네트워크로 통합하고 시간적 출력과 융합한다.
  • 결과를 tanh 활성화를 통해 [-1,1]로 매핑하여, 과거 데이터의 평균 제곱 오차를 최소화하도록 학습한다.
  • Adam 최적화로 학습하고 수렴을 개선하기 위해 잔차 유닛에서 BN을 사용한다.

실험 결과

연구 질문

  • RQ1공간-시간 데이터를 사용하여 도시 전역의 유입/유출을 각 지역별로 얼마나 정확하게 예측할 수 있는가?
  • RQ2근접성, 주기, 추세에 대한 개별 잔차 네트워크가 단일 모델보다 예측을 개선하는가?
  • RQ3외부 요인을 효과적으로 통합하여 예측 정확도를 높일 수 있는가?
  • RQ4지역 및 시간 인식 융합 메커니즘이 다양한 도시 구역에서 성능을 향상시키는가?

주요 결과

모델RMSE
HA57.69
ARIMA22.78
SARIMA26.88
VAR22.88
ST-ANN19.57
DeepST18.18
ST-ResNet L2-E17.67
ST-ResNet L4-E17.51
ST-ResNet L12-E16.89
ST-ResNet L12-E-BN16.69
ST-ResNet L12-single-E17.40
ST-ResNet L1217.00
ST-ResNet L12-E-noFusion17.96
BikeNYC ST-ResNet (4 RU)6.33
DeepST-C8.39
DeepST-CP7.64
DeepST-CPT7.56
DeepST-CPTM7.43
  • ST-ResNet 변형은 TaxiBJ 베이징 데이터에서 여섯 가지 기준선(HA, ARIMA, SARIMA, VAR, ST-ANN, DeepST)을 consistently 뛰어넘는다.
  • TaxiBJ에서 최적 ST-ResNet 구성(L12-E-BN)은 RMSE 16.69를 달성하며, 16.89(L12-E) 및 17.00(L12 무융합)과 대비된다.
  • 외부 요인이 성능을 향상시키며, E(외부)가 있는 모델이 없는 것보다 우수하다(예: L12-E 대 L12).
  • 파라메트릭 행렬 기반 융합이 단순 가법 융합(L12-E-noFusion)보다 의미 있게 우수하다.
  • BikeNYC에서 네 개의 잔차 단위를 가진 ST-ResNet은 RMSE 6.33으로 모든 기준선보다 우수하며, DeepST 변형들(예: DeepST-CPTM 7.43)을 능가한다.
  • 이 접근법은 서로 다른 도시 데이터셋(Beijing TaxiBJ 및 NYC BikeNYC)에 잘 일반화된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.