QUICK REVIEW

[论文解读] Deep Learning for Predicting Asset Returns

Guanhao Feng, Jingyu He|arXiv (Cornell University)|Apr 25, 2018

Stock Market Forecasting Methods参考文献 33被引用 23

一句话总结

本文提出一种深度学习框架，利用多层非线性因子——特别是ReLU和LSTM网络——以改进股票收益的样本外预测，优于传统线性模型。结果表明，深度学习能够捕捉特征空间中的非线性关系，尤其是在收益极端情况下的关系，并通过随机梯度下降和TensorFlow进行优化与模型训练，在Welch和Goyal（2008）数据集上实现了更优的预测性能。

ABSTRACT

Deep learning searches for nonlinear factors for predicting asset returns. Predictability is achieved via multiple layers of composite factors as opposed to additive ones. Viewed in this way, asset pricing studies can be revisited using multi-layer deep learners, such as rectified linear units (ReLU) or long-short-term-memory (LSTM) for time-series effects. State-of-the-art algorithms including stochastic gradient descent (SGD), TensorFlow and dropout design provide imple- mentation and efficient factor exploration. To illustrate our methodology, we revisit the equity market risk premium dataset of Welch and Goyal (2008). We find the existence of nonlinear factors which explain predictability of returns, in particular at the extremes of the characteristic space. Finally, we conclude with directions for future research.

研究动机与目标

开发一种基于深度学习的资产收益预测方法，使用非线性、分层因子而非加法线性模型。
评估深度学习是否能够提升实证资产定价中的样本外预测性能，特别是捕捉经济特征中的非线性关系。
比较深度学习与传统方法（如OLS、Ridge、Lasso、Elastic Net）以及基于树的模型在预测股权风险溢价和市场崩盘方面的表现。
探讨深度学习在金融预测中的可解释性与局限性，尤其是关于因果关系和模型透明度方面。

提出的方法

采用具有多层隐藏层的深度神经网络架构，每层对输入的加权组合应用非线性激活函数（例如ReLU）。
使用随机梯度下降（SGD）配合TensorFlow进行高效训练与超参数调优。
应用dropout正则化以防止过拟合并提升高维预测变量空间中的泛化能力。
构建包含三层（32、16、8个神经元）的深度动态因子模型，从诸如市盈率（d/p）和市盈率（e/p）等经济预测因子中提取潜在的非线性因子。
使用移动窗口与累积滚动窗口相结合的方法，评估不同模型类型在样本外R²表现上的差异。
在月度收益率低于-10%的市场崩盘二分类任务中，将深度学习与基于树的模型（CART、提升法、随机森林）进行比较。

实验结果

研究问题

RQ1与线性模型相比，采用非线性复合因子的深度学习模型是否能提升股票收益的样本外预测能力？
RQ2深度学习模型是否能检测并利用特征空间中的非线性关系，特别是在收益分布极端情况下的关系？
RQ3在预测市场崩盘方面，深度学习与传统正则化方法（如Lasso、Ridge）以及基于树的模型相比表现如何？
RQ4通过ReLU和LSTM实现的分层非线性因子提取在提升资产定价预测准确性方面起到何种作用？

主要发现

深度学习模型，特别是DL2和DL3，在预测一个月期股票收益时，其样本外R²值高于线性模型（OLS、Ridge、Lasso）和正则化方法（ElasticNet）。
具有三层隐藏层（32、16、8个神经元）的深度学习模型生成了8个潜在的非线性因子，这些因子与关键预测因子（如市盈率d/p和红利收益率d/y）表现出强烈的非线性关系。
在捕捉尾部分布行为方面，深度学习优于基于树的模型（CART、提升法、随机森林），能预测出更多市场崩盘事件，尽管所有模型均存在对实际崩盘事件的低估。
该模型展现出更优的样本内拟合效果，并能更好地分类极端市场波动，表明其在检测非线性风险因子方面具有优势。
尽管存在可解释性不足和缺乏因果推断的局限，深度学习仍为实证资产定价中的传统加法因子模型提供了一种强有力的替代方案。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。