[논문 리뷰] Retail Demand Forecasting: A Comparative Study for Multivariate Time Series
이 논문은 소매 수요 시계열을 거시경제 변수(CPI, ICS, 실업률)로 확장하고, 회귀 및 ML 모델을 비교하여 과거 판매 데이터만으로 얻는 예측 이익을 평가한다.
Accurate demand forecasting in the retail industry is a critical determinant of financial performance and supply chain efficiency. As global markets become increasingly interconnected, businesses are turning towards advanced prediction models to gain a competitive edge. However, existing literature mostly focuses on historical sales data and ignores the vital influence of macroeconomic conditions on consumer spending behavior. In this study, we bridge this gap by enriching time series data of customer demand with macroeconomic variables, such as the Consumer Price Index (CPI), Index of Consumer Sentiment (ICS), and unemployment rates. Leveraging this comprehensive dataset, we develop and compare various regression and machine learning models to predict retail demand accurately.
연구 동기 및 목표
- 거시경제 지표를 소매 수요 예측에 통합하여 소비자 행동에 대한 외부 경제 효과를 포착한다.
- 거시경제 변수의 포함이 다중 회귀 및 머신 러닝 모델 전반의 예측 정확도를 향상시키는지 평가한다.
- 소매 수요 예측을 위해 거시경제 정보의 활용 효과가 가장 큰 모델과 특징을 식별한다.
제안 방법
- Walmart 소매 데이터 세트(CA_1 매장 하위 집합)를 5년 동안 3,049개 상품과 함께 구성하고, WDI와 미시간 대학교 자료에서 CPI, ICS, 실업 데이터를 보강한다.
- 가격, 프로모션, 달력 효과, 시차 수요(lag_t28), 롤링 통계(7/30/60/90/180일) 및 시간 및 상품 ID에 대한 지시변수를 포함한 풍부한 특징 집합을 구성한다.
- Baseline 및 매크로 확장 특징에 대해 다섯 모델(Lasso, Ridge, LightGBM, XGBoost, Decision Tree)을 적용하고 RMSE와 MAE를 평가 지표로 비교한다.
- 모델 전반에 걸친 특징 중요도 분석을 수행하여 거시경제 변수의 예측 정확도 기여도를 확인한다.
실험 결과
연구 질문
- RQ1거시경제 지표(CPI, ICS, 실업률)를 포함하는 것이 다중 모델에서 소매 수요 예측 정확도를 향상시키는가?
- RQ2어떤 모델이 RMSE 및 MAE 측면에서 거시경제 특징으로부터 가장 큰 이점을 얻는가?
- RQ3거시경제 및 파생 특징 중 소매 수요의 가장 중요한 예측 변수로 부상하는 것은 무엇인가?
주요 결과
| Model | RMSE Without Macro | RMSE With Macro | MAE Without Macro | MAE With Macro |
|---|---|---|---|---|
| Lasso | 1.80239 | 1.79865 | 0.88665 | 0.88479 |
| Ridge | 1.73869 | 1.73848 | 0.84552 | 0.84567 |
| LGBM | 1.71740 | 1.71504 | 0.84859 | 0.84742 |
| XGBM | 1.72164 | 1.71581 | 0.84126 | 0.83918 |
| Decision Tree | 2.35698 | 2.36479 | 1.00046 | 1.00170 |
- 거시경제 요인은 모델 전반에 걸쳐 예측 정확도에 대해 일반적으로 미미한 개선에서 눈에 띄는 개선까지 이르는 이점을 제공한다.
- LightGBM은 거시 변수 추가로 가장 큰 성능 향상을 보인다(RMSE: 1.71740에서 1.71504로; MAE: 0.84859에서 0.84742로).
- XGBoost도 거시 데이터의 이점을 누린다(RMSE: 1.72164에서 1.71581로; MAE: 0.84126에서 0.83918로).
- Lasso와 Ridge는 거시 데이터로 인해 더 작거나 혼재된 개선을 보인다(Lasso RMSE 1.80239→1.79865; Ridge RMSE 1.73869→1.73848).
- Decision Tree의 성능은 거시 특징으로 약간 악화된다(RMSE 2.35698→2.36479; MAE 1.00046→1.00170).
- 특징 중요도 분석은 다수의 모델에서 거시경제 변수(ICS, CPI 등)가 상위 예측 변수로 일관되게 포함된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.