QUICK REVIEW

[논문 리뷰] Time Series Foundation Models as Strong Baselines in Transportation Forecasting: A Large-Scale Benchmark Analysis

Javier Pulido, Filipe Rodrigues|arXiv (Cornell University)|2026. 02. 27.

Traffic Prediction and Management Techniques인용 수 0

한 줄 요약

이 논문은 시간 시계열 기초 모델 Chronos-2를 10개의 실제 교통 데이터셋에 대해 제로샷 베 baseline으로 평가하여, 상태-of-the-art 예측 성능에 근접하거나 경쟁적이며, 과제별 학습 없이도 확률 예측을 제공한다는 것을 보여준다.

ABSTRACT

Accurate forecasting of transportation dynamics is essential for urban mobility and infrastructure planning. Although recent work has achieved strong performance with deep learning models, these methods typically require dataset-specific training, architecture design and hyper-parameter tuning. This paper evaluates whether general-purpose time-series foundation models can serve as forecasters for transportation tasks by benchmarking the zero-shot performance of the state-of-the-art model, Chronos-2, across ten real-world datasets covering highway traffic volume and flow, urban traffic speed, bike-sharing demand, and electric vehicle charging station data. Under a consistent evaluation protocol, we find that, even without any task-specific fine-tuning, Chronos-2 delivers state-of-the-art or competitive accuracy across most datasets, frequently outperforming classical statistical baselines and specialized deep learning architectures, particularly at longer horizons. Beyond point forecasting, we evaluate its native probabilistic outputs using prediction-interval coverage and sharpness, demonstrating that Chronos-2 also provides useful uncertainty quantification without dataset-specific training. In general, this study supports the adoption of time-series foundation models as a key baseline for transportation forecasting research.

연구 동기 및 목표

일반-purpose 시간 시계열 기초 모델(TS-FMs)이 다양한 교통 작업에서 제로샷 예측기로 작용할 수 있는지 평가한다.
highway/도시 교통, 자전거 대여, EV 충전 데이터를 포함하는 10개의 실제 데이터셋에서 Chronos-2를 벤치마킹한다.
Deterministic 정확도(MAE, RMSE, MAPE)와 확률적 예측 품질(교정 및 선명도)을 모두 평가한다.
교통 예측 연구에서 TS-FMs을 baselines로 사용하는 실용적 지침을 제공한다.

제안 방법

Chronos-2(그룹 어텐션을 포함한 인코더-전용 변환기 기반 TS-FM)를 10개 교통 데이터셋의 제로샷 예측에 사용한다.
표준 평가 프로토콜을 유지하며, 모델의 중앙값 분위수에서 도출된 슬라이딩 윈도우 기반의 일관된 평가를 수행한다( MAE, RMSE, MAPE ).
교정 및 선명도 평가를 위해 Chronos-2의 기본 21 분위수 출력을 활용하여 80% 예측 구간을 형성한다.
데이터셋별 맥락 토큰 수를 포함한 과거 일주일의 맥락으로 상황을 제공한다.
Chronos-2를 고전적 baselines 및 전문 DL 모델과 비교하고, HA 및 최상의 DL 경쟁자 대비 개선을 보고한다.

실험 결과

연구 질문

RQ1단일 TS-FM(Chronos-2)이 작업별 세부 튜닝 없이도 광범위한 교통 예측 작업에서 최첨단 수준의 성능이나 경쟁적인 성능을 달성할 수 있는가?
RQ2제로샷 Chronos-2가 전통적 baselines 및 전문 모델과 비교했을 때 장기 예측에서 어떤 성능을 보이는가?
RQ3Chronos-2의 확률적 예측은 데이터셋 전반에서 좋은 교정 및 선명도를 보이는가?
RQ4교통 예측 연구에서 TS-FMs를 표준 baselines로 사용함에 있어 실용성과 잠재력은 어떤가?

주요 결과

Chronos-2가 대부분의 데이터셋에서 최첨단 또는 매우 경쟁적인 결정론적 예측(MAE, RMSE, MAPE)을 제공하며, 종종 고전적 및 DL baselines를 능가한다.
제로샷 Chronos-2는 많은 자기회귀 또는 수평선 의존 모델보다 더 긴 구간에서 정확도를 더 잘 유지한다.
Chronos-2는 많은 데이터셋에서 교정이 약 80%에 근접하고 선명도가 강해, 재학습 없이도 불확실성 정량화를 가능하게 하는 의미 있는 확률적 예측을 제공한다.
전반적으로 TS-FMs는 튜토리얼하고 CPU 친화적 추론이 가능하며 교통 예측 연구의 표준 baselines으로 적합하다는 것을 시사한다.
일부 데이터셋 특이적 역학(예: METR-LA)은 Chronos-2의 일반화 혜택을 유지하면서도 명시적 공간 인접성을 도입하면 이익이 있을 수 있음을 시사한다.
UrbanEV 결과는 마지막 관찰 기준보다 상당한 개선을 보여, EV 관련 예측에 대한 TS-FMs의 적용 가능성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.