Skip to main content
QUICK REVIEW

[论文解读] Gradient Boosting Application in Forecasting of Performance Indicators Values for Measuring the Efficiency of Promotions in FMCG Retail

Joanna Henzel, Marek Sikora|arXiv (Cornell University)|May 30, 2020
Forecasting Techniques and Applications参考文献 37被引用 11
一句话总结

本文提出了一种基于XGBoost的新型方法,利用历史数据和超参数优化,预测快消品零售促销活动的六个绩效指标。该方法通过预测销售额、购物篮规模等结果,实现数据驱动的促销规划,RMSE改进最高达70.39(客户数量预测),相较于基线模型表现出更优的准确性。

ABSTRACT

In the paper, a problem of forecasting promotion efficiency is raised. The authors propose a new approach, using the gradient boosting method for this task. Six performance indicators are introduced to capture the promotion effect. For each of them, within predefined groups of products, a model was trained. A description of using these models for forecasting and optimising promotion efficiency is provided. Data preparation and hyperparameters tuning processes are also described. The experiments were performed for three groups of products from a large grocery company.

研究动机与目标

  • 解决利用机器学习预测快消品零售促销效果的挑战。
  • 开发一种可预测超出简单销售额的多个绩效指标的模型。
  • 通过识别影响预测结果的关键特征,优化促销规划。
  • 通过使用贝叶斯优化进行系统性超参数调优,提升预测准确性。
  • 为零售商提供一个实用框架,可在促销活动发布前模拟和优化未来促销。

提出的方法

  • 定义了六个绩效指标——AVG. AMOUNT、AVG. NB. RECEIPTS、AVG. BASKET、AVG. BASKET WITHOUT ITEM、AVG. NB. UNIQUE ITEMS、AVG. NB. CLIENTS——以全面衡量促销效率。
  • 在乳制品、水果和蔬菜三个产品组内,分别为每个指标单独训练XGBoost回归模型。
  • 特征工程包括时间、价格、竞争和人口统计属性(如价格变动、一年中的日期、500米内人口数、竞争对手数量)。
  • 使用贝叶斯优化中的树状结构帕尔兹估计器(TPE)对超参数进行优化,提升了所有指标的模型准确性。
  • 模型评估采用RMSE,通过对比优化前后性能量化改进程度。
  • 提取特征重要性以指导促销调优,识别出价格变动和人口密度等关键预测因子。

实验结果

研究问题

  • RQ1XGBoost能否有效预测快消品促销的多个绩效指标,而不仅限于基本的销售额?
  • RQ2超参数优化对XGBoost模型预测促销结果准确性的影响如何?
  • RQ3哪些特征对预测促销成功最具影响力,以及如何指导规划?
  • RQ4在产品组上训练的单一模型是否具备足够的泛化能力,以预测新促销或低促销产品?
  • RQ5不同指标(如购物篮规模与客户数量)对促销属性变化的响应程度如何?

主要发现

  • 在乳制品组中,经过超参数优化后,XGBoost模型在AVG. NB. CLIENTS指标上的RMSE最高降低了70.39。
  • RMSE改善最大的是AVG. NB. CLIENTS指标(70.39),其次是水果组中的AVG. AMOUNT(9.72)和AVG. BASKET WITHOUT ITEM(5.83)。
  • 价格变动和当前价格是预测销售额(AVG. AMOUNT)最重要的特征,表明价格对需求具有显著影响。
  • 对于AVG. NB. CLIENTS等指标,人口密度和旅游比例等特征最具影响力,表明促销特定属性的直接影响有限。
  • 前五位特征因指标而异,人口统计和竞争因素在购物篮和客户预测中起关键作用。
  • 该模型框架可通过模拟属性变化并重新预测,实现促销的迭代优化,支持数据驱动的决策制定。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。