[论文解读] Improving Long-Horizon Forecasts with Expectation-Biased LSTM Networks
该论文提出了一种期望偏差LSTM网络,通过聚类(K-means)或目标序列平均来引入模型偏差,以提升长时序预测性能。通过在序列步骤中复制目标值并注入学习到的偏差,该方法显著降低了平均绝对误差——在阿尔茨海默病脑室体积预测任务中,相较于单变量LSTM,MAE降低了47%,并在美国电力消费预测任务中优于基线模型。
State-of-the-art forecasting methods using Recurrent Neural Net- works (RNN) based on Long-Short Term Memory (LSTM) cells have shown exceptional performance targeting short-horizon forecasts, e.g given a set of predictor features, forecast a target value for the next few time steps in the future. However, in many applica- tions, the performance of these methods decays as the forecasting horizon extends beyond these few time steps. This paper aims to explore the challenges of long-horizon forecasting using LSTM networks. Here, we illustrate the long-horizon forecasting problem in datasets from neuroscience and energy supply management. We then propose expectation-biasing, an approach motivated by the literature of Dynamic Belief Networks, as a solution to improve long-horizon forecasting using LSTMs. We propose two LSTM ar- chitectures along with two methods for expectation biasing that significantly outperforms standard practice.
研究动机与目标
- 解决使用深度RNN(特别是LSTM)进行长时序时间序列预测时的不准确性问题。
- 通过在模型中引入结构化偏差,克服长期预测中的指数级误差增长问题。
- 通过利用长时间跨度内的时序和因果依赖关系,提升多变量预测性能。
- 在真实世界数据集(阿尔茨海默病进展和美国电力消费)上验证方法的有效性。
- 提出一种新颖的训练策略,通过序列目标值复制来稳定长期梯度传播。
提出的方法
- 引入一个偏差模块,通过K-means聚类或平均方法,学习长序列中具有代表性的目标模式。
- 应用序列目标值复制:将最终目标值在整个序列的所有时间步中进行复制,以提供一致的误差信号。
- 使用Adam优化器,在500至1000个周期内训练一个两层LSTM,每层包含64个记忆单元。
- 使用可变长度序列以适应纵向数据中不规则的患者就诊时间表。
- 对输入特征(脑室体积、人口统计学特征等)进行归一化,并将时间序列转换为监督学习格式。
- 进行两次训练:一次使用标准目标值,一次使用复制后的目标值,以增强长期泛化能力。
实验结果
研究问题
- RQ1将学习到的偏差引入LSTM是否能超越标准RNN,在长时序预测中提升准确性?
- RQ2在序列步骤中复制目标值如何影响梯度稳定性和长期预测性能?
- RQ3通过K-means聚类目标序列是否能产生优于简单平均或无偏差的长期预测结果?
- RQ4所提出方法在长期医疗和能源预测任务中,与持续性模型和经典多变量LSTM基线相比表现如何?
- RQ5在长时序预测中,偏差表示的最优聚类中心数量是多少?
主要发现
- 所提出的Model 1(采用K-means偏差,K=2)在ADNI数据集上的平均绝对误差(MAE)降低至0.002673,相较于单变量LSTM基线(0.005042)降低了47%。
- 基于平均的偏差方法也实现了0.002673的MAE,优于单变量LSTM,并与最佳K-means配置表现相当。
- 在美国电力消费预测任务中,通过K-means引入偏差在所有测试聚类数下均提升了准确性,K=2时达到最低MAE。
- 目标值复制显著提升了模型性能,尤其是在与偏差注入结合时,有效减缓了长期预测中的误差增长。
- 采用K-means偏差(K=2)的模型在阿尔茨海默病和能源数据集上均优于所有基线模型,包括经典多变量LSTM和持续性模型。
- 该方法在不同数据模态和预测时长下均表现出鲁棒性,验证了其在长期时间预测任务中的通用性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。