[论文解读] Retail Demand Forecasting: A Comparative Study for Multivariate Time Series
本论文通过将宏观经济变量(CPI、ICS、失业率)纳入零售需求时间序列,并比较回归模型和机器学习模型,以评估超越历史销售数据的预测提升。
Accurate demand forecasting in the retail industry is a critical determinant of financial performance and supply chain efficiency. As global markets become increasingly interconnected, businesses are turning towards advanced prediction models to gain a competitive edge. However, existing literature mostly focuses on historical sales data and ignores the vital influence of macroeconomic conditions on consumer spending behavior. In this study, we bridge this gap by enriching time series data of customer demand with macroeconomic variables, such as the Consumer Price Index (CPI), Index of Consumer Sentiment (ICS), and unemployment rates. Leveraging this comprehensive dataset, we develop and compare various regression and machine learning models to predict retail demand accurately.
研究动机与目标
- 推动将宏观经济指标纳入零售需求预测,以捕捉外部经济对消费者行为的影响。
- 评估在多种回归和机器学习模型中,纳入宏观经济变量是否能提高预测准确性。
- 确定哪些模型与特征最有效地利用宏观经济信息进行零售需求预测。
提出的方法
- 组装一个沃尔玛零售数据集(CA_1 店面子集),覆盖五年,包含3,049个产品,并增添来自WDI和密歇根大学来源的CPI、ICS和失业数据。
- 构建丰富的特征集,包括价格、促销、日历效应、滞后需求(lag_t28)、滚动统计(7/30/60/90/180天)以及时间和产品ID的指示变量。
- 在基线特征和宏观 enriched 特征上应用并比较五种模型(Lasso、Ridge、LightGBM、XGBoost、Decision Tree),以 RMSE 和 MAE 作为评估指标。
- 在各模型中进行特征重要性分析,以确定宏观经济变量对预测准确性的贡献。
实验结果
研究问题
- RQ1将宏观经济指标(CPI、ICS、失业)纳入是否能在多模型中提升零售需求预测的准确性?
- RQ2在 RMSE 和 MAE 方面,哪些模型从宏观经济特征中获得的收益最大?
- RQ3哪些宏观经济指标及其推导特征成为零售需求最重要的预测因子?
主要发现
| 模型 | 无宏观变量的 RMSE | 有宏观变量的 RMSE | 无宏观变量的 MAE | 有宏观变量的 MAE |
|---|---|---|---|---|
| Lasso | 1.80239 | 1.79865 | 0.88665 | 0.88479 |
| Ridge | 1.73869 | 1.73848 | 0.84552 | 0.84567 |
| LGBM | 1.71740 | 1.71504 | 0.84859 | 0.84742 |
| XGBM | 1.72164 | 1.71581 | 0.84126 | 0.83918 |
| Decision Tree | 2.35698 | 2.36479 | 1.00046 | 1.00170 |
- 宏观经济特征通常在各模型中带来预测准确性的温和到显著提升。
- LightGBM 在加入宏观变量后获得最大的性能提升(RMSE:1.71740 变为 1.71504;MAE:0.84859 变为 0.84742)。
- XGBoost 也从宏观数据中受益(RMSE:1.72164 变为 1.71581;MAE:0.84126 变为 0.83918)。
- Lasso 和 Ridge 显示在宏观数据上的改进较小或混合(Lasso RMSE 1.80239→1.79865;Ridge RMSE 1.73869→1.73848)。
- Decision Tree 在宏观特征下表现略有恶化(RMSE 2.35698→2.36479;MAE 1.00046→1.00170)。
- 特征重要性分析在若干模型中始终将宏观经济变量(ICS、CPI 等)列为最重要的预测因子之一。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。