Skip to main content
QUICK REVIEW

[논문 리뷰] Gradient Boosting Application in Forecasting of Performance Indicators Values for Measuring the Efficiency of Promotions in FMCG Retail

Joanna Henzel, Marek Sikora|arXiv (Cornell University)|2020. 05. 30.
Forecasting Techniques and Applications참고 문헌 37인용 수 11
한 줄 요약

이 논문은 히스토리컬 데이터와 하이퍼파ram터 최적화를 활용하여 FMCG 소매 유통의 프ом모션에 대한 6개의 성과 지표를 예측하기 위한 새로운 XGBoost 기반 접근법을 제안한다. 이 방법은 판매량 및 장바구니 크기와 같은 결과 예측을 통해 데이터 기반 프ом모션 기획을 가능하게 하며, 고객 수 예측에서 최대 70.39%의 RMSE 향상을 보이며 기준 모델 대비 뛰어난 정확도를 입증한다.

ABSTRACT

In the paper, a problem of forecasting promotion efficiency is raised. The authors propose a new approach, using the gradient boosting method for this task. Six performance indicators are introduced to capture the promotion effect. For each of them, within predefined groups of products, a model was trained. A description of using these models for forecasting and optimising promotion efficiency is provided. Data preparation and hyperparameters tuning processes are also described. The experiments were performed for three groups of products from a large grocery company.

연구 동기 및 목표

  • 기계학습을 활용하여 FMCG 소매 유통에서 프로모션 효과성 예측의 과제를 해결하기 위해.
  • 단순한 판매량을 넘어서 다양한 성과 지표를 예측할 수 있는 모델을 개발하기 위해.
  • 예측 결과에 영향을 주는 핵심 특징을 파악하여 프로모션 기획을 최적화하기 위해.
  • 베이지안 최적화를 활용한 체계적 하이퍼파ram터 튜닝을 통해 예측 정확도를 향상시키기 위해.
  • 소매업체가 출시 전에 향후 프로모션을 시뮬레이션하고 최적화할 수 있는 실용적인 프레임워크를 제공하기 위해.

제안 방법

  • 프로모션 효율성을 종합적으로 측정하기 위해, 평균 금액(AVG. AMOUNT), 평균 영수증 수(AVG. NB. RECEIPTS), 평균 장바구니 크기(AVG. BASKET), 항목 제외 평균 장바구니 크기(AVG. BASKET WITHOUT ITEM), 평균 고유 품목 수(AVG. NB. UNIQUE ITEMS), 평균 고객 수(AVG. NB. CLIENTS)의 6개 성과 지표를 정의하였다.
  • 우유, 과일, 채소의 3개 제품군 내에서 각 지표별로 별도로 XGBoost 회귀 모델을 훈련시켰다.
  • 특징 공학에는 시간적, 가격, 경쟁, 인구통계적 특징(예: 가격 변화, 연중 일수, 500m 이내 인구 수, 경쟁사 수 등)이 포함되었다.
  • 모델 정확도 향상을 위해 트리 기반 파르젠 추정기(Tree-structured Parzen Estimator, TPE)를 활용한 베이지안 최적화를 통해 하이퍼파ram터를 최적화하였다.
  • 모델 평가에는 RMSE를 사용하였으며, 최적화 이전 및 이후 성능을 비교하여 향상도를 정량화하였다.
  • 프로모션 최적화를 안내하기 위해 특징 중요도를 추출하였으며, 가격 변화 및 인구 밀도와 같은 주요 예측 변수를 파악하였다.

실험 결과

연구 질문

  • RQ1XGBoost는 기본 판매량을 넘어서 FMCG 프로모션의 다수 성과 지표를 효과적으로 예측할 수 있는가?
  • RQ2하이퍼파ram터 최적화는 XGBoost 모델의 프로모션 결과 예측 정확도에 어떤 영향을 미치는가?
  • RQ3프로모션 성공을 예측하는 데 가장 영향을 미치는 특징는 무엇이며, 이를 기반으로 기획을 어떻게 도울 수 있는가?
  • RQ4제품군 기반으로 훈련된 단일 모델이 신규 또는 프로모션 빈도가 낮은 제품에 대해 충분히 일반화 가능한가?
  • RQ5예를 들어 장바구니 크기와 고객 수와 같은 다양한 지표는 프로모션 특성의 변화에 얼마나 다르게 반응하는가?

주요 결과

  • 하이퍼파ram터 최적화 이후, 우유 제품군에서 AVG. NB. CLIENTS 지표의 RMSE가 최대 70.39% 감소하였다.
  • RMSE 향상도가 가장 높은 지표는 AVG. NB. CLIENTS(70.39%)였으며, 이어 과일 제품군에서 AVG. AMOUNT(9.72)와 AVG. BASKET WITHOUT ITEM(5.83)의 순서로 나타났다.
  • 판매량(AVG. AMOUNT) 예측에 있어 가장 중요한 특징은 가격 변화와 현재 가격였으며, 이는 수요에 대한 가격의 강력한 영향을 시사한다.
  • AVG. NB. CLIENTS와 같은 지표의 경우, 인구 밀도와 관광 비율 등의 특징이 가장 영향력 있었으며, 이는 프로모션 특성의 직접적 영향이 제한적임을 시사한다.
  • 상위 5개 특징는 지표에 따라 달라졌으며, 인구통계적 및 경쟁 요소가 장바구니 및 고객 수 예측에서 핵심 역할을 하였다.
  • 특성 변경을 시뮬레이션하고 재예측하는 방식으로 반복적인 프로모션 최적화가 가능해져, 데이터 기반 의사결정 지원이 가능하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.