Skip to main content
QUICK REVIEW

[論文レビュー] Gradient Boosting Application in Forecasting of Performance Indicators Values for Measuring the Efficiency of Promotions in FMCG Retail

Joanna Henzel, Marek Sikora|arXiv (Cornell University)|May 30, 2020
Forecasting Techniques and Applications参考文献 37被引用数 11
ひとこと要約

本稿では、履歴データとハイパーパramータ最適化を用いて、FMCG小売におけるプロモーションの6つのパフォーマンス指標を予測する、XGBoostに基づく新規アプローチを提案する。この手法により、販売数量やバスケットサイズなどの予測結果をもとに、データドリブンなプロモーション計画が可能となり、クライアント数予測においてRMSEが最大70.39%改善され、ベースラインモデルを上回る高い精度を示している。

ABSTRACT

In the paper, a problem of forecasting promotion efficiency is raised. The authors propose a new approach, using the gradient boosting method for this task. Six performance indicators are introduced to capture the promotion effect. For each of them, within predefined groups of products, a model was trained. A description of using these models for forecasting and optimising promotion efficiency is provided. Data preparation and hyperparameters tuning processes are also described. The experiments were performed for three groups of products from a large grocery company.

研究の動機と目的

  • 機械学習を用いてFMCG小売におけるプロモーション効果の予測に取り組む。
  • 単なる販売数量を超えた複数のパフォーマンス指標を予測するモデルを開発する。
  • 予測結果に影響を与える重要な特徴量を同定することで、プロモーション計画の最適化を図る。
  • ベイズ最適化を用いた体系的なハイパーパramータチューニングにより、予測精度を向上させる。
  • 小売業者がプロモーションを公開する前に、将来のプロモーションをシミュレート・最適化できる実用的フレームワークを提供する。

提案手法

  • プロモーション効率を包括的に測定するため、6つのパフォーマンス指標(AVG. AMOUNT、AVG. NB. RECEIPTS、AVG. BASKET、AVG. BASKET WITHOUT ITEM、AVG. NB. UNIQUE ITEMS、AVG. NB. CLIENTS)を定義した。
  • 乳製品、果物、野菜の3つの製品グループに分け、各指標ごとにXGBoost回帰モデルを別々に訓練した。
  • 特徴量工学には、時系列的要因、価格要因、競合状況、人口統計的属性(例:価格変更、年間の日付、500m圏内人口、競合店舗数)を含めた。
  • Tree-structured Parzen Estimator(TPE)を用いたベイズ最適化によりハイパーパramータを最適化し、全指標においてモデル精度が向上した。
  • モデル評価にはRMSEを用い、最適化前後での性能差を定量的に評価した。
  • 特徴量の重要度を抽出し、プロモーション最適化の根拠とした。価格変更や人口密度が特に重要な予測要因であることが判明した。

実験結果

リサーチクエスチョン

  • RQ1XGBoostは、基本的な販売数量を超えた複数のFMCGプロモーション指標を効果的に予測できるか?
  • RQ2ハイパーパramータ最適化は、XGBoostモデルのプロモーション結果予測精度にどのように影響するか?
  • RQ3プロモーション成功の予測に最も影響を与える特徴量は何か。また、それらは計画立案にどのように活用できるか?
  • RQ4製品グループに学習させた1つのモデルは、新規または低プロモーション製品に対しても十分に一般化できるか?
  • RQ5バスケットサイズとクライアント数といった異なる指標は、プロモーション属性の変化にどの程度反応するか?

主な発見

  • ハイパーパramータ最適化後、乳製品グループのAVG. NB. CLIENTS指標において、RMSEが最大70.39%低減した。
  • RMSEの改善度が最も顕著だったのはAVG. NB. CLIENTS(70.39%)、次に果物グループのAVG. AMOUNT(9.72%)、AVG. BASKET WITHOUT ITEM(5.83%)であった。
  • 販売数量(AVG. AMOUNT)の予測において、価格変更と現在の価格が最も重要な特徴量であった。これは需要に価格が強く影響することを示している。
  • AVG. NB. CLIENTSのような指標では、人口密度や観光比率といった要因が最も影響力が強く、プロモーション固有の属性の影響は限定的であることが示された。
  • 上位5つの特徴量は指標ごとに異なり、人口統計的要因および競合状況要因がバスケットおよびクライアント予測において重要な役割を果たした。
  • 本モデルフレームワークにより、属性の変更をシミュレートし再予測することで、繰り返しのプロモーション最適化が可能となり、データドリブンな意思決定を支援できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。