[논문 리뷰] Reinforcement Learning-Guided Dynamic Multi-Graph Fusion for Evacuation Traffic Prediction
RL-DMF를 소개하는 프레임워크로, 두 가지 동적 그래프(거리 및 주행 시간)와 강화학습을 결합하여 기능 선택을 통해 허리케인 시 대피 교통량을 예측하며 최첨단 정확도와 해석가능성을 달성한다.
Real-time traffic prediction is critical for managing transportation systems during hurricane evacuations. Although data-driven graph-learning models have demonstrated strong capabilities in capturing the complex spatiotemporal dynamics of evacuation traffic at a network level, they mostly consider a single dimension (e.g., travel-time or distance) to construct the underlying graph. Furthermore, these models often lack interpretability, offering little insight into which input variables contribute most to their predictive performance. To overcome these limitations, we develop a novel Reinforcement Learning-guided Dynamic Multi-Graph Fusion (RL-DMF) framework for evacuation traffic prediction. We construct multiple dynamic graphs at each time step to represent heterogeneous spatiotemporal relationships between traffic detectors. A dynamic multi-graph fusion (DMF) module is employed to adaptively learn and combine information from these graphs. To enhance model interpretability, we introduce RL-based intelligent feature selection and ranking (RL-IFSR) method that learns to mask irrelevant features during model training. The model is evaluated using a real-world dataset of 12 hurricanes affecting Florida from 2016 to 2024. For an unseen hurricane (Milton, 2024), the model achieves a 95% accuracy (RMSE = 293.9) for predicting the next 1-hour traffic flow. Moreover, the model can forecast traffic flow for up to next 6 hours with 90% accuracy (RMSE = 426.4). The RL-DMF framework outperforms several state-of-the-art traffic prediction models. Furthermore, ablation experiments confirm the effectiveness of dynamic multi-graph fusion and RL-IFSR approaches for improving model performance. This research provides a generalized and interpretable model for real-time evacuation traffic forecasting, with significant implications for evacuation traffic management.
연구 동기 및 목표
- 허리케인 시 빠르고 확률적인 대피 교통 패턴이 나타나며 정적 그래프와 단일 특징 모델이 저조한 성능을 보이는 문제를 다룬다.
- 거리 기반 및 주행 시간 기반 관계를 공동으로 포착하기 위해 동적 다중 그래프 융합 프레임워크를 개발한다.
- 강화 학습 기반 지능형 특징 선택 및 순위 매김(RL-IFSR)으로 모델 해석가능성을 향상시킨다.
- 플로리다의 여러 허리케인 및 네트워크 구간에 걸쳐 일반화 가능성과 견고성을 시연한다.
제안 방법
- 각 시간 단계에서 두 개의 시계열 그래프를 구성한다: 거리 기반 그래프와 주행 시간 기반 그래프.
- 그래프별로 분리된 합성연산을 적용하고 노드별 주의 메커니즘을 통해 출력을 융합한다.
- 두 개의 합성된 노드 임베딩의 시간적 진화를 모델링하고 다단계 미래의 트래픽 흐름을 예측하기 위해 LSTM을 사용한다.
- 저유용 특징을 마스킹하고 훈련 중 특징 중요도를 랭킹하는 Double Deep Q-Network 기반 RL-IFSR를 도입한다.
- 우선 경험 재생 및 DDQN 타깃을 사용하여 학습을 안정화시키고 샘플 효율성을 향상시킨다.
실험 결과
연구 질문
- RQ1거리 그래프와 주행 시간 그래프의 동적 다중 그래프 융합이 단일 그래프 또는 정적 그래프 기반 기준선보다 대피 교통 예측 성능을 향상시킬 수 있는가?
- RQ2RL 기반 특징 마스킹이 데이터 부족과 급격한 대피 동역학에서 해석 가능성과 견고함을 향상시키는가?
- RQ3제안된 프레임워크가 플로리다의 미지의 허리케인 및 서로 다른 네트워크 조건에 얼마나 잘 일반화되는가?
주요 결과
- RL-DMF가 기준 모델(LSTM, CNN-LSTM, 고정 GCN-LSTM, 거리 그래프 또는 주행 시간 그래프를 사용하는 동적 GCN-LSTM)보다 모든 평가 지표에서 우수하다.
- 허리케인 Milton의 경우, 1시간 앞 예측 RMSE 293.9, MAE 189.5, MAPE 17.9%, R2 0.95.
- 1–6시간 예측 구간에서 RMSE는 293.9에서 495.3까지이며 R2는 0.86 이상으로 유지되고 Overall RMSE 426.4, MAE 281.1, MAPE 25.2%, R2 0.90.
- 거리 및 주행 시간 그래프의 상보적 공간 의존성을 활용하여 예측을 개선한다.
- RL-IFSR는 훈련 중 저유용 특징을 마스킹하여 해석 가능한 특징 순위를 제공하고, 데이터 부족 상황에서의 대피에서 견고함을 강화한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.