[论文解读] Predicting Economic Recessions Using Machine Learning Algorithms
本文提出使用随机森林机器学习算法,通过训练实时金融市场价格指标,预测美国和英国的经济衰退。结果显示,该模型可提前六个季度预测2008–2009年经济衰退,且预测结果与实际结果具有统计显著的相关性,优于传统基于调查的预测方法在长期预测中的表现。
Even at the beginning of 2008, the economic recession of 2008/09 was not being predicted. The failure to predict recessions is a persistent theme in economic forecasting. The Survey of Professional Forecasters (SPF) provides data on predictions made for the growth of total output, GDP, in the United States for one, two, three and four quarters ahead since the end of the 1960s. Over a three quarters ahead horizon, the mean prediction made for GDP growth has never been negative over this period. The correlation between the mean SPF three quarters ahead forecast and the data is very low, and over the most recent 25 years is not significantly different from zero. Here, we show that the machine learning technique of random forests has the potential to give early warning of recessions. We use a small set of explanatory variables from financial markets which would have been available to a forecaster at the time of making the forecast. We train the algorithm over the 1970Q2-1990Q1 period, and make predictions one, three and six quarters ahead. We then re-train over 1970Q2-1990Q2 and make a further set of predictions, and so on. We did not attempt any optimisation of predictions, using only the default input parameters to the algorithm we downloaded in the package R. We compare the predictions made from 1990 to the present with the actual data. One quarter ahead, the algorithm is not able to improve on the SPF predictions. Three and six quarters ahead, the correlations between actual and predicted are low, but they are very significantly different from zero. Although the timing is slightly wrong, a serious downturn in the first half of 2009 could have been predicted six quarters ahead in late 2007. The algorithm never predicts a recession when one did not occur. We obtain even stronger results with random forest machine learning techniques in the case of the United Kingdom.
研究动机与目标
- 为解决传统经济预测方法持续无法预测重大经济衰退(如2008–2009年全球金融危机)的问题。
- 评估机器学习方法(特别是随机森林)是否能仅通过及时可得的金融指标,改善经济下行的早期预警信号。
- 比较机器学习预测结果与《专业预测者调查》(SPF)在长期预测(三季和六季 ahead)中的表现。
- 通过从1970年至2017年在滚动时间窗口中反复重新训练模型,评估模型的稳健性与可靠性。
- 判断模型是否能避免误报,即在无衰退发生时从不预测衰退。
提出的方法
- 本研究采用随机森林分类器,基于在每次预测时可获得的一组少量金融市场价格变量进行训练。
- 训练过程采用滚动窗口:从1970年第二季度至1990年第一季度开始,随后逐步扩展至1990年第二季度、第三季度,依此类推,直至2017年。
- 模型对提前一季、三季和六季的经济走势进行预测,使用R包中的默认超参数,未进行任何调优。
- 将预测结果与实际GDP增长率数据以及同期《专业预测者调查》(SPF)的平均预测值进行对比。
- 通过假设检验评估预测结果与实际经济衰退之间相关性的统计显著性。
- 分别针对美国和英国评估模型的预测准确性和时间精度。
实验结果
研究问题
- RQ1基于实时金融指标训练的随机森林模型,是否能比传统预测方法更早预测出重大经济衰退?
- RQ2在三季和六季预测时间范围内,机器学习模型的预测准确性与《专业预测者调查》(SPF)相比如何?
- RQ3模型是否能可靠避免误报,即在无经济下行时从不发出衰退预警?
- RQ4该模型在多大程度上能够提前预判2008–2009年全球金融危机,以及最远可提前多久?
- RQ5当模型在滚动时间窗口中反复重新训练时,其预测性能是否依然显著且稳定?
主要发现
- 随机森林模型成功在提前六个季度预测到2008–2009年美国经济衰退,且预测结果与实际结果之间具有统计显著的相关性。
- 对于三季和六季前瞻预测,模型预测值与实际GDP增长率之间的相关性显著不同于零,尽管相关系数的绝对值较低。
- 该模型从未发出过误报的衰退信号,在无衰退发生时正确判断为无衰退。
- 尽管在提前一季预测中,该模型未超越《专业预测者调查》(SPF)的表现,但在更长预测时间范围内显著优于SPF预测。
- 在英国经济中的预测能力甚至更强,表明该方法具有跨国应用的潜力。
- 结果表明,诸如随机森林等机器学习技术,仅依赖及时可得的可观测金融数据,即可为经济衰退提供早期预警信号。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。