QUICK REVIEW

[论文解读] Investigation Into The Effectiveness Of Long Short Term Memory Networks For Stock Price Prediction

Hengjian Jia|arXiv (Cornell University)|Mar 25, 2016

Stock Market Forecasting Methods参考文献 4被引用 63

一句话总结

本研究使用谷歌的历史股价数据（2005–2015）评估长短期记忆（LSTM）网络在股票价格预测中的表现。通过采用滑动窗口和ADAM优化的渐进式预训练策略，该模型在3层、250个单元的LSTM上实现了最低测试均方根误差（RMSE）0.0105，优于无变化基线模型（RMSE 0.0265）。

ABSTRACT

The effectiveness of long short term memory networks trained by backpropagation through time for stock price prediction is explored in this paper. A range of different architecture LSTM networks are constructed trained and tested.

研究动机与目标

评估LSTM网络在使用时间序列数据预测股价走势方面的有效性。
探究相比简单模型，更深更宽的LSTM架构是否能提升预测准确率。
评估一种新型渐进式预训练策略（基于滑动窗口）对模型收敛性和性能的影响。
将LSTM性能与简单的无变化基线模型进行比较，以验证其预测实用性。
检验LSTM在参数量远超训练样本数量的情况下对过拟合的鲁棒性。

提出的方法

在归一化的每日股价收益率（开盘价、最高价、最低价、收盘价、成交量）上训练1至3层隐藏层、单元数在50至500之间的LSTM网络。
通过滑动窗口方法构建输入序列，初始序列长度为2，并逐步加倍至256，以实现渐进式预训练。
模型使用硬Sigmoid门和tanh激活函数，通过SVD进行权重初始化，以确保隐藏状态动态的稳定性。
遗忘门偏置初始化为1，其他偏置初始化为0，以促进长期依赖关系的学习。
数据通过以下方式归一化为日收益率：$ \hat{x}_t = \frac{x_t}{x_{t-1}} - 1 $，以减小尺度并提升训练稳定性。
使用ADAM优化器，采用默认超参数，并保持每批次20个序列的固定批量大小。

实验结果

研究问题

RQ1LSTM能否有效学习股价时间序列中的时间模式，从而实现准确预测？
RQ2在基于LSTM的股价预测中，网络深度和宽度如何影响预测性能？
RQ3使用序列长度由2逐步增加至256的滑动窗口进行渐进式预训练，是否能提升模型收敛性和最终准确率？
RQ4与简单的无变化基线模型相比，LSTM模型在RMSE指标上的表现如何？
RQ5尽管参数量远超唯一训练序列数量，该模型是否仍对过拟合具有鲁棒性？

主要发现

3层、250个单元的LSTM实现了最低的测试RMSE 0.0105，表明其具有出色的预测性能。
该模型始终优于无变化基线模型（RMSE 0.0265），证实其具备实际学习到的预测能力。
增加网络深度和宽度通常能提升性能，其中3层、250个单元的配置取得了最佳结果。
采用从长度2到256的滑动窗口进行渐进式预训练的策略，提升了训练稳定性和收敛性。
尽管参数量远超训练样本数量，该模型表现出对过拟合的强抵抗力，各架构间性能保持一致。
表现最佳的模型（3层、250个单元）相比基线模型实现了58.5%的RMSE降低，展现出显著的预测优势。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。