Skip to main content
QUICK REVIEW

[논문 리뷰] Deep Time-Series Models Meet Volatility: Multi-Horizon Electricity Price Forecasting in the Australian National Electricity Market

Mohammed Osman Gani, Zhipeng He|arXiv (Cornell University)|2026. 02. 01.
Energy Load and Power Forecasting인용 수 0
한 줄 요약

논문은 변동성이 큰 호주 NEM에서 일-선호(day-ahead) 및 이틀-선호(two-day-ahead) 전력 가격 예측을 위한 최첨단 딥 타임-시리즈 모델들을 평가하고, 이를 표준 DL 베이스라인과 비교하며, 실시간 intraday 및 극값(price extreme) 성능을 분석한다.

ABSTRACT

Accurate electricity price forecasting (EPF) is increasingly difficult in markets characterised by extreme volatility, frequent price spikes, and rapid structural shifts. Deep learning (DL) has been increasingly adopted in EPF due to its ability to achieve high forecasting accuracy. Recently, state-of-the-art (SOTA) deep time-series models have demonstrated promising performance across general forecasting tasks. Yet, their effectiveness in highly volatile electricity markets remains underexplored. Moreover, existing EPF studies rarely assess how model accuracy varies across intraday periods, leaving model sensitivity to market conditions unexplored. To address these gaps, this paper proposes an EPF framework that systematically evaluates SOTA deep time-series models using a direct multi-horizon forecasting approach across day-ahead and two-day-ahead settings. We conduct a comprehensive empirical study across all five regions of the Australian National Electricity Market using contemporary, high-volatility data. The results reveal a clear gap between time-series benchmark expectations and observed performance under real-world price volatility: recent deep time-series models often fail to surpass standard DL baselines. All models experience substantial degradation under extreme and negative prices, yet DL baselines often remain competitive. Intraday performance analysis further reveals that all evaluated models are consistently vulnerable to prevailing market conditions, where absolute errors peak during evening ramps, relative errors escalate during midday negative-price periods, and directional accuracy deteriorates sharply during abrupt shifts in price direction. These findings emphasise the need for volatility-aware modelling strategies and richer feature representations to advance EPF.

연구 동기 및 목표

  • Australian NEM의 현대적 고변동성 전력 시장 조건에서 최첨단 딥 타임-시리즈 모델의 효과를 평가한다.
  • 일중 간격에 따라 예측 정확도가 어떻게 달라지는지 검토하여 시간대별 및 시장 상황 민감성을 드러낸다.
  • 일-선호와 이틀-선호 해상도에서 SOTA 시계열 아키텍처와 표준 DL 베이스라인 간의 엄격한 비교를 제공한다.
  • 변동성 인지형 모델링 전략을 위한 EPF를 위한 intraday 진단을 가능하게 한다.

제안 방법

  • 48개의 반-hour 간격(일-선호)을 예측하고 96개 간격(이틀-선호)을 예측하기 위해 7일 및 14일 회귀 윈도우를 사용하는 직접 다중 수평 예측 접근법을 사용한다.
  • 다음 모델들을 평가한다: 두 가지 표준 DL 베이스라인(LSTM, CNN-LSTM, Transformer)과 여러 SOTA 시계열 아키텍처(TimeXer, TimeMixer, TimesNet, iTransformer, Mamba, DLinear 등).
  • 5분 해상도 데이터를 2023-2025년 데이터로 5개 NEM 지역에서 구성하고 30분 간격으로 집계한다.
  • horizon 및 지역별로 포괄적인 하이퍼파라미터 그리드 검색을 수행하고, Adam으로 학습하며 조기 중단 및 ReduceLROnPlateau를 적용한다; 특징을 Min–Max 스케일링으로 정규화한다.
  • 성능을 MAE, RMSE, sMAPE, rMAE, 및 MDA로 평가하고 꼬리(극값) 및 intraday(48개의 반-hour 간격) 성능을 분석한다.
  • 연대순(train/validation/test) 분할(2023-2024 학습/검증, 2025 테스트)과 공개 코드 및 데이터 아티팩트를 공유한다.
Figure 1: An overview of the proposed EPF evaluation framework, encompassing stages from data collection to performance evaluation.
Figure 1: An overview of the proposed EPF evaluation framework, encompassing stages from data collection to performance evaluation.

실험 결과

연구 질문

  • RQ1상세최첨단 딥 타임-시리즈 모델이 실제 NEM 가격 시계열에서 표준 DL 베이스라인보다 우수한가?
  • RQ2모델의 정확도는 intraday 간격 및 극값 또는 음수 가격 조건에서 어떻게 달라지는가?
  • RQ3딥 타임-시리즈 예측 아키텍처의 진보가 5개 NEM 지역 전반에서 견고한 EPF 성능으로 이어지는가?
  • RQ4일-선호 대비 이틀-선호 해상도에서 다양한 모델 계열(LSTM, CNN-LSTM, Transformer, SOTA 시계열 아키텍처)의 상대 강점은 무엇인가?

주요 결과

  • SOTA 딥 타임-시리즈 모델은 자주 변동성이 큰 NEM 맥락에서 표준 DL 베이스라인을 능가하지 못한다.
  • 대부분의 모델은 극값 및 음수 가격에서 성능이 저하되지만, DL 베이스라인은 이러한 구간에서도 경쟁력이 있다.
  • intraday 분석은 예측 오차가 저녁 램프 구간에서 정점에 이르고 방향성 정확도가 급격한 가격 변화 동안 악화된다는 것을 보여준다.
  • CNN-LSTM 및 LSTM은 여러 지역과 해상도에서 자주 상위 성능을 차지하는 반면, TimeXer는 VIC에서, Mamba는 QLD/SA에서 지역 특화 이점을 제공한다.
  • DLinear 및 TimeMixer는 일반적으로 표준 DL 베이스라인에 비해 성능이 떨어지는 반면, TimeXer는 일부 해상도에서 강력한 베이스라인 후보로 부상한다.
  • 음수 가격 기간은 모든 아키텍처에서 모델의 한계를 드러내며, 단일 SOTA 모델이 음수 가격 하에서 베이스라인을 지속적으로 능가하지는 않는다.
(a) MAE of all models in the QLD region, evaluated at 30-minute intervals.
(a) MAE of all models in the QLD region, evaluated at 30-minute intervals.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.