[論文レビュー] Retail Demand Forecasting: A Comparative Study for Multivariate Time Series
この論文は、マクロ経済指標(CPI、ICS、失業率)を加えた小売需要の時系列データを用い、回帰モデルと機械学習モデルを比較して、過去の販売データだけでは得られない予測利得を評価する。
Accurate demand forecasting in the retail industry is a critical determinant of financial performance and supply chain efficiency. As global markets become increasingly interconnected, businesses are turning towards advanced prediction models to gain a competitive edge. However, existing literature mostly focuses on historical sales data and ignores the vital influence of macroeconomic conditions on consumer spending behavior. In this study, we bridge this gap by enriching time series data of customer demand with macroeconomic variables, such as the Consumer Price Index (CPI), Index of Consumer Sentiment (ICS), and unemployment rates. Leveraging this comprehensive dataset, we develop and compare various regression and machine learning models to predict retail demand accurately.
研究の動機と目的
- 小売需要予測におけるマクロ経済指標の統合を促し、消費者行動への外部経済効果を捉える。
- マクロ経済変数の追加が複数の回帰モデルと機械学習モデルで予測精度を改善するかを評価する。
- マクロ経済情報を小売需要予測に活用するうえで、どのモデルと特徴量が最も効果的かを特定する。
提案手法
- CA_1ストアの5年間のWalmart小売データセットを構築。商品は3,049点、CPI、ICS、失業率データをWDIおよびミシガン大学ソースから付加。
- 価格、プロモーション、カレンダー効果、ラグ需要(lag_t28)、ローリング統計(7/30/60/90/180日)、時点および商品IDの指標変数を含むリッチな特徴セットを構築。
- ベースライン特徴とマクロ経済変数を組み合わせた5つのモデル(Lasso、Ridge、LightGBM、XGBoost、Decision Tree)をRMSEとMAEを評価指標として適用・比較。
- モデル間でマクロ経済変数の予測精度への寄与を特定する特徴量重要度分析を実施。
実験結果
リサーチクエスチョン
- RQ1マクロ経済指標(CPI、ICS、失業率)を組み込むことは、複数モデルにわたる小売需要予測の精度を向上させるか。
- RQ2どのモデルがマクロ経済特徴量からの利益をRMSEとMAEの観点で最も受けるか。
- RQ3どのマクロ経済指標および導出特徴量が小売需要の最も重要な予測因子として現れるか。
主な発見
| モデル | マクロなしのRMSE | マクロありのRMSE | マクロなしのMAE | マクロありのMAE |
|---|---|---|---|---|
| Lasso | 1.80239 | 1.79865 | 0.88665 | 0.88479 |
| Ridge | 1.73869 | 1.73848 | 0.84552 | 0.84567 |
| LGBM | 1.71740 | 1.71504 | 0.84859 | 0.84742 |
| XGBM | 1.72164 | 1.71581 | 0.84126 | 0.83918 |
| Decision Tree | 2.35698 | 2.36479 | 1.00046 | 1.00170 |
- マクロ経済特徴量は、モデル間で予測精度の改善を概して modest から顕著な範囲で示す。
- LightGBMはマクロ変数追加によって最大の性能向上を示す(RMSE: 1.71740 → 1.71504; MAE: 0.84859 → 0.84742)。
- XGBoostもマクロデータから利益を得る(RMSE: 1.72164 → 1.71581; MAE: 0.84126 → 0.83918)。
- LassoとRidgeはマクロデータで小幅または混合的な改善を示す(Lasso RMSE 1.80239→1.79865; Ridge RMSE 1.73869→1.73848)。
- Decision Treeのパフォーマンスはマクロ特徴でわずかに悪化する(RMSE 2.35698→2.36479; MAE 1.00046→1.00170)。
- 特徴量重要度分析は、ICS、CPIなどのマクロ経済変数を複数モデルの上位予測因子として一貫して含んでいる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。