[论文解读] Stock Price Correlation Coefficient Prediction with ARIMA-LSTM Hybrid Model
该论文提出一个 ARIMA-LSTM 混合方法来预测未来股票对相关系数,并在多个时间段和资产集上相对于传统模型显示出更优的预测性能。ARIMA 处理线性部分,LSTM 捕捉非线性残差,并通过前滚测试进行评估。
Predicting the price correlation of two assets for future time periods is important in portfolio optimization. We apply LSTM recurrent neural networks (RNN) in predicting the stock price correlation coefficient of two individual stocks. RNNs are competent in understanding temporal dependencies. The use of LSTM cells further enhances its long term predictive properties. To encompass both linearity and nonlinearity in the model, we adopt the ARIMA model as well. The ARIMA model filters linear tendencies in the data and passes on the residual value to the LSTM model. The ARIMA LSTM hybrid model is tested against other traditional predictive financial models such as the full historical model, constant correlation model, single index model and the multi group model. In our empirical study, the predictive ability of the ARIMA-LSTM model turned out superior to all other financial models by a significant scale. Our work implies that it is worth considering the ARIMA LSTM model to forecast correlation coefficient for portfolio optimization.
研究动机与目标
- 通过准确预测未来股票相关性来推动投资组合优化。
- 将线性(ARIMA)与非线性(LSTM)时间序列建模相结合,以捕捉相关性数据中的趋势与复杂模式。
- 在标准模型下对预测性能进行评估,并在时间段和资产子集上评估鲁棒性。
- 使用前滚评估框架和多指标(MSE、RMSE、MAE)检验泛化能力。
提出的方法
- 使用 ARIMA 建模并滤除相关时间序列的线性成分以获得残差。
- 在 ARIMA 残差上训练 LSTM 以捕捉非线性动力学。
- 将 24-step 输入结构与 20-step 序列结合用于 LSTM 训练。
- 通过开发阶段和两个测试期的前滚优化评估模型,比较 MSE、RMSE 与 MAE。
- 将 ARIMA-LSTM 与 Full Historical、Constant Correlation、Single-Index、Multi-Group 模型进行对比。
实验结果
研究问题
- RQ1ARIMA-LSTM 混合模型是否在股票对相关系数的预测误差(MSE/MAE/RMSE)方面低于传统模型?
- RQ2ARIMA-LSTM 模型在不同时间段(开发、Test1、Test2)和资产子集上的表现如何?
- RQ3ARIMA-LSTM 方法对在标普 500 指数内不同股票选择是否鲁棒?
- RQ4混合模型相对于传统相关性预测器在投资组合优化中的相对改进是多少?
主要发现
- ARIMA-LSTM 在所有数据集上实现了最低的预测误差,开发期 MSE 为 0.1786,Test1 为 0.1889,Test2 为 0.2154。
- ARIMA-LSTM 模型在开发期和测试期的 MSE、RMSE、MAE 上均优于所有基准模型(Full Historical、Constant Correlation、Single-Index、Multi-Group)。
- 在开发、Test1、Test2 上,Constant Correlation 模型在非混合模型中表现最好,但在所有指标上都落后于 ARIMA-LSTM。
- 对 10 组随机资产集的鲁棒性检验显示 MSE 值区间为 0.1447 到 0.2353,表明在资产之间的性能稳定。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。