[论文解读] AutoGluon-TimeSeries: AutoML for Probabilistic Time Series Forecasting
AutoGluon-TimeSeries (AG–TS) 是一个开源的 probabilistic time series forecasting 的 AutoML 库,构建多样模型的集合,包括统计、深度学习和表格预测器,以最少的代码(3 行)提供准确的点预报和分位数预报。
We introduce AutoGluon-TimeSeries - an open-source AutoML library for probabilistic time series forecasting. Focused on ease of use and robustness, AutoGluon-TimeSeries enables users to generate accurate point and quantile forecasts with just 3 lines of Python code. Built on the design philosophy of AutoGluon, AutoGluon-TimeSeries leverages ensembles of diverse forecasting models to deliver high accuracy within a short training time. AutoGluon-TimeSeries combines both conventional statistical models, machine-learning based forecasting approaches, and ensembling techniques. In our evaluation on 29 benchmark datasets, AutoGluon-TimeSeries demonstrates strong empirical performance, outperforming a range of forecasting methods in terms of both point and quantile forecast accuracy, and often even improving upon the best-in-hindsight combination of prior methods.
研究动机与目标
- 通过提供易于使用的 AutoML 工具,让概率时间序列预测民主化。
- 通过集成将多样化预测模型(统计、DL、表格)结合起来,以提高准确性和鲁棒性。
- 支持共变量(静态和时间变化)时,实现点预测和分位预测。
- 在广泛的基准数据集上评估性能,以证明具有竞争力的准确性和效率。
提出的方法
- TimeSeriesDataFrame 存储具有静态和时间变化共变量的一组单变量序列。
- TimeSeriesPredictor 定义预测任务,包括 prediction_length、quantile levels 和 evaluation metric;支持交叉验证和可选的超参数优化。
- 拟合过程对数据进行预处理、训练并评估多个模型,可选地调优超参数,并通过前向选择(对于概率预测使用 Vincentization)构建集成。
- 三大模型族:局部经典模型(如 ARIMA、Theta、ETS)按序列;全局模型(深度学习:DeepAR、PatchTST、TFT;表格模型通过 AutoGluon–Tabular + MLForecast);以及集成以产生最终预测。
- 预测输出包括在水平上的均值(点)和分位预测,存储在长格式 DataFrame 中,包含 IDs、时间戳和预测值。
实验结果
研究问题
- RQ1AutoGluon–TimeSeries 在多样化的单变量时间序列数据集上能否提供具有竞争力的点预报和概率预报?
- RQ2在真实的时间预算下,基于集合的 AutoML 方法是否优于单独模型和其他 AutoML 预测框架?
- RQ3包含多样化模型族(统计、深度学习、表格)和集成对预测准确性和运行时的影响?
- RQ4预设和时间预算约束如何影响准确性和最终用户的实用性?
主要发现
| 框架 | 胜利 | 失败 | 平局 | 失败次数 | 冠军 | 平均排名 | 平均重新缩放误差 | 相对于基线的胜率 |
|---|---|---|---|---|---|---|---|---|
| AutoGluon (MASE) | - | - | - | 0 | 19 | 2.08 | 0.073 | 100.0% |
| StatEnsemble | 6 | 20 | 0 | 3 | 3 | 3.12 | 0.238 | 82.8 % |
| AutoPyTorch (MASE) | 4 | 25 | 0 | 0 | 2 | 4.12 | 0.257 | 93.1% |
| AutoETS | 4 | 25 | 0 | 0 | 1 | 4.64 | 0.374 | 75.9 % |
| AutoTheta | 4 | 23 | 0 | 2 | 0 | 4.92 | 0.427 | 72.4 % |
| DeepAR | 4 | 24 | 0 | 1 | 2 | 5.08 | 0.434 | 93.1 % |
| AutoARIMA | 4 | 22 | 0 | 3 | 1 | 5.92 | 0.612 | 79.3 % |
| TFT | 2 | 27 | 0 | 0 | 1 | 6.12 | 0.635 | 75.9 % |
| Table 3 (points) - as listed above |
- AG–TS 在29个基准数据集上,点预测(MASE)和概率预测(wQL)均优于竞争框架。
- 一个包含多样模型并通过前向选择的集合实现了强准确性,通常超越事先择最佳组合。
- 三大模型族(统计、深度学习、表格)对性能有显著贡献,消融研究表明三者均有益;集成尤其关键。
- AG–TS 维持可观的运行时,在所有数据集上都能在4小时预算内完成训练和预测,平均运行时约33分钟。
- 与 AutoPyTorch 相比,AG–TS 在较大数据集上提供具有竞争力的性能、设置更简单且通常更快,而 AutoPyTorch 可能需要更多调优和时间。
- 消融研究显示,移除集成或任一模型族都会降低性能,强调了集成 AutoML 方法的重要性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。