[论文解读] RobustSTL: A Robust Seasonal-Trend Decomposition Algorithm for Long Time Series
RobustSTL 提出了一种新颖的季节性-趋势分解算法,通过使用最小绝对偏差(LAD)损失与 ℓ₁ 正则化,并结合非局部季节性滤波,能够从具有高噪声、季节性变化和突变的长时序数据中稳健地提取趋势和季节性成分。该方法在处理异常值、趋势突变和长季节周期(例如 T=1440)方面优于 STL、TBATS 和 STR,在合成数据和真实世界数据集上均实现了更高的精度和计算效率。
Decomposing complex time series into trend, seasonality, and remainder components is an important task to facilitate time series anomaly detection and forecasting. Although numerous methods have been proposed, there are still many time series characteristics exhibiting in real-world data which are not addressed properly, including 1) ability to handle seasonality fluctuation and shift, and abrupt change in trend and reminder; 2) robustness on data with anomalies; 3) applicability on time series with long seasonality period. In the paper, we propose a novel and generic time series decomposition algorithm to address these challenges. Specifically, we extract the trend component robustly by solving a regression problem using the least absolute deviations loss with sparse regularization. Based on the extracted trend, we apply the the non-local seasonal filtering to extract the seasonality component. This process is repeated until accurate decomposition is obtained. Experiments on different synthetic and real-world time series datasets demonstrate that our method outperforms existing solutions.
研究动机与目标
- 解决现有时间序列分解方法在处理长季节周期、季节性变化以及趋势和残差中突变时的局限性。
- 提升在真实世界时间序列数据(尤其是物联网和监控应用)中对异常值的鲁棒性。
- 开发一种可扩展且高效的分解方法,确保在高频、长周期季节性数据(例如 1 分钟数据的 T=1440)上保持高精度。
- 通过在复杂真实世界条件下隔离有意义的分量(趋势、季节性、残差),实现对异常检测和预测的准确分解。
提出的方法
- 通过使用最小绝对偏差(LAD)损失与 ℓ₁-范数正则化求解回归问题,提取趋势分量,以确保鲁棒性和稀疏性。
- 通过非局部季节性滤波估计季节性分量,该方法通过利用序列中相似的历史模式,捕捉灵活、偏移和时变的季节性模式。
- 通过在趋势估计和季节性滤波之间交替迭代,持续优化趋势和季节性分量,直至收敛。
- 该方法被表述为一个带 ℓ₁ 正则化的凸优化问题,即使在长时序数据上也能实现高效且可扩展的计算。
- 该方法专为加法分解设计,可轻松适配乘法形式。
- 通过交叉验证对超参数(如邻居窗口大小 K, H 和正则化系数 λ₁, λ₂)进行调优,以实现最佳性能。
实验结果
研究问题
- RQ1一种分解方法是否能稳健地处理高噪声长时序数据中的季节性变化和波动?
- RQ2在存在异常值的情况下,一种方法在检测和保留趋势与残差中的突变方面有多高效?
- RQ3一种分解算法在不出现性能退化的情况下,能多大程度上扩展到具有极长季节周期(例如 T=1440)的时间序列?
- RQ4在真实世界和合成数据集上,该方法与 STL、TBATS 和 STR 等最先进算法相比,在精度和效率方面表现如何?
主要发现
- 在合成数据上,RobustSTL 达到了最低的平均绝对误差(MAE)0.0750,显著优于 STL(0.1915)、STR(0.3004)和 TBATS(0.2770)。
- 在真实世界数据集 1(T=12)上,RobustSTL 准确捕捉了趋势突变和季节性变化,而标准 STL 和 STR 受到异常值和水平突变的干扰。
- 在真实世界数据集 2(T=288)上,RobustSTL 有效提取了平滑且自适应的季节性分量,并在残差中保留了尖峰异常值,而 TBATS 和标准 STL 受到异常值的影响。
- 由于其高效的优化公式,RobustSTL 的计算速度显著快于 TBATS 和 STR,尤其在长时序数据上表现更优。
- 该算法有效处理了分数季节性和偏移季节性,无需固定季节对齐即可适应变化的模式。
- 在合成和真实世界实验中,RobustSTL 在复杂真实世界时间序列的鲁棒性、精度和可扩展性方面始终优于现有方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。