[论文解读] Improving forecasting with sub-seasonal time series patterns
本文提出了一种简单且与模型无关的方法,通过将原始时间序列分解为多个子季节性变体,分别使用经典模型(ETS/ARIMA)对每个变体进行预测,并以相等权重组合预测结果,从而提升时间序列预测的准确性——尤其在高频数据中表现显著,已在M1、M3、M4及实际的小时级负荷数据上展现出稳健的性能提升。
Time series forecasting plays an increasingly important role in modern business decisions. In today's data-rich environment, people often aim to choose the optimal forecasting model for their data. However, identifying the optimal model often requires professional knowledge and experience, making accurate forecasting a challenging task. To mitigate the importance of model selection, we propose a simple and reliable algorithm and successfully improve the forecasting performance. Specifically, we construct multiple time series with different sub-seasons from the original time series. These derived series highlight different sub-seasonal patterns of the original series, making it possible for the forecasting methods to capture diverse patterns and components of the data. Subsequently, we make forecasts for these multiple series separately with classical statistical models (ETS or ARIMA). Finally, the forecasts of these multiple series are combined with equal weights. We evaluate our approach on the widely-used forecasting competition datasets (M1, M3, and M4), in terms of both point forecasts and prediction intervals. We observe improvements in performance compared with the benchmarks. Our approach is particularly suitable and robust for the datasets with higher frequencies. To demonstrate the practical value of our proposition, we showcase the performance improvements from our approach on hourly load data.
研究动机与目标
- 解决时间序列预测中最优模型选择的挑战,该挑战通常需要专家知识与经验。
- 通过利用单个时间序列内部的多样化子季节性模式,降低对模型选择的依赖。
- 在不增加模型复杂度的前提下,提升预测准确性和可靠性,尤其针对高频数据。
- 通过在实际的小时级电力负荷数据上的应用,证明方法的实用性。
- 提供一种稳健、简单且可推广的方法,适用于多种预测场景。
提出的方法
- 通过调整季节周期,从原始序列中提取多个子季节性时间序列,以突出不同的周期性模式。
- 对每个提取的子季节性序列分别应用经典统计模型——ETS或ARIMA进行预测。
- 通过等权重方式组合所有子季节性序列的预测结果,生成最终预测。
- 通过仅依赖标准统计模型和简单分解,确保方法与模型无关。
- 在多个数据集(M1、M3、M4)和真实世界数据中使用相同的预测框架,以保证一致性和可复现性。
- 通过点预测和预测区间对方法进行验证,并与现有基准模型进行性能对比。
实验结果
研究问题
- RQ1将时间序列分解为多个子季节性变体,是否能在多样化数据集上提升预测准确性?
- RQ2与基准模型相比,该方法在点预测和预测区间方面的表现如何?
- RQ3该方法是否在高频时间序列(如小时级负荷数据)中表现出显著优势?
- RQ4性能提升是否在不同预测竞赛(M1、M3、M4)和数据类型中均具鲁棒性?
- RQ5基于子季节性序列的简单等权重集成预测,是否能超越更复杂的模型选择策略?
主要发现
- 在M1、M3和M4预测竞赛数据集上,所提方法在预测准确性上显著优于基准模型。
- 性能提升在高频时间序列(如小时级电力负荷数据)中最为显著,因为此类数据的子季节性模式更复杂且多变。
- 该方法在点预测和预测区间覆盖率方面均持续提升,表明预测可靠性增强。
- 即使不进行调优,基于子季节性序列的等权重集成预测也优于单一模型选择。
- 该方法在多种数据类型和频率下表现出鲁棒性,表明其在真实世界预测场景中具有广泛适用性。
- 该方法无需高级建模专业知识,使不具备深厚统计知识的从业者也能轻松使用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。