QUICK REVIEW

[论文解读] Improving Long-Horizon Forecasts with Expectation-Biased LSTM Networks

Aya Abdelsalam Ismail, Timothy Wood|arXiv (Cornell University)|Apr 18, 2018

Stock Market Forecasting Methods参考文献 13被引用 23

一句话总结

该论文提出了一种期望偏差LSTM网络，通过聚类（K-means）或目标序列平均来引入模型偏差，以提升长时序预测性能。通过在序列步骤中复制目标值并注入学习到的偏差，该方法显著降低了平均绝对误差——在阿尔茨海默病脑室体积预测任务中，相较于单变量LSTM，MAE降低了47%，并在美国电力消费预测任务中优于基线模型。

ABSTRACT

State-of-the-art forecasting methods using Recurrent Neural Net- works (RNN) based on Long-Short Term Memory (LSTM) cells have shown exceptional performance targeting short-horizon forecasts, e.g given a set of predictor features, forecast a target value for the next few time steps in the future. However, in many applica- tions, the performance of these methods decays as the forecasting horizon extends beyond these few time steps. This paper aims to explore the challenges of long-horizon forecasting using LSTM networks. Here, we illustrate the long-horizon forecasting problem in datasets from neuroscience and energy supply management. We then propose expectation-biasing, an approach motivated by the literature of Dynamic Belief Networks, as a solution to improve long-horizon forecasting using LSTMs. We propose two LSTM ar- chitectures along with two methods for expectation biasing that significantly outperforms standard practice.

研究动机与目标

解决使用深度RNN（特别是LSTM）进行长时序时间序列预测时的不准确性问题。
通过在模型中引入结构化偏差，克服长期预测中的指数级误差增长问题。
通过利用长时间跨度内的时序和因果依赖关系，提升多变量预测性能。
在真实世界数据集（阿尔茨海默病进展和美国电力消费）上验证方法的有效性。
提出一种新颖的训练策略，通过序列目标值复制来稳定长期梯度传播。

提出的方法

引入一个偏差模块，通过K-means聚类或平均方法，学习长序列中具有代表性的目标模式。
应用序列目标值复制：将最终目标值在整个序列的所有时间步中进行复制，以提供一致的误差信号。
使用Adam优化器，在500至1000个周期内训练一个两层LSTM，每层包含64个记忆单元。
使用可变长度序列以适应纵向数据中不规则的患者就诊时间表。
对输入特征（脑室体积、人口统计学特征等）进行归一化，并将时间序列转换为监督学习格式。
进行两次训练：一次使用标准目标值，一次使用复制后的目标值，以增强长期泛化能力。

实验结果

研究问题

RQ1将学习到的偏差引入LSTM是否能超越标准RNN，在长时序预测中提升准确性？
RQ2在序列步骤中复制目标值如何影响梯度稳定性和长期预测性能？
RQ3通过K-means聚类目标序列是否能产生优于简单平均或无偏差的长期预测结果？
RQ4所提出方法在长期医疗和能源预测任务中，与持续性模型和经典多变量LSTM基线相比表现如何？
RQ5在长时序预测中，偏差表示的最优聚类中心数量是多少？

主要发现

所提出的Model 1（采用K-means偏差，K=2）在ADNI数据集上的平均绝对误差（MAE）降低至0.002673，相较于单变量LSTM基线（0.005042）降低了47%。
基于平均的偏差方法也实现了0.002673的MAE，优于单变量LSTM，并与最佳K-means配置表现相当。
在美国电力消费预测任务中，通过K-means引入偏差在所有测试聚类数下均提升了准确性，K=2时达到最低MAE。
目标值复制显著提升了模型性能，尤其是在与偏差注入结合时，有效减缓了长期预测中的误差增长。
采用K-means偏差（K=2）的模型在阿尔茨海默病和能源数据集上均优于所有基线模型，包括经典多变量LSTM和持续性模型。
该方法在不同数据模态和预测时长下均表现出鲁棒性，验证了其在长期时间预测任务中的通用性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。