Skip to main content
QUICK REVIEW

[論文レビュー] Scalable bundling via dense product embeddings

Madhav Kumar, Dean Eckles|ArXiv.org|Jan 31, 2020
Web Data Mining and Analysis参考文献 34被引用数 25
ひとこと要約

本論文は、歴史的購入データおよびクリックストリームデータから学習した密度の高い製品埋め込みを用いて、スケーラブルでデータ駆動型のクロスカテゴリーエコマースにおけるバンドル化を実現する機械学習駆動の手法を提案する。購入と検索の埋め込みにおける近接性を、補完性と代替性のヒューリスティックとして用い、大規模な現実世界実験を通じてバンドルのパフォーマンスを評価した。その結果、埋め込みに基づくヒューリスティックは、カテゴリをまたいでバンドル成功を安定して予測でき、効率的かつ一般化可能なバンドル設計を可能にした。

ABSTRACT

Bundling, the practice of jointly selling two or more products at a discount, is a widely used strategy in industry and a well examined concept in academia. Historically, the focus has been on theoretical studies in the context of monopolistic firms and assumed product relationships, e.g., complementarity in usage. We develop a new machine-learning-driven methodology for designing bundles in a large-scale, cross-category retail setting. We leverage historical purchases and consideration sets created from clickstream data to generate dense continuous representations of products called embeddings. We then put minimal structure on these embeddings and develop heuristics for complementarity and substitutability among products. Subsequently, we use the heuristics to create multiple bundles for each product and test their performance using a field experiment with a large retailer. We combine the results from the experiment with product embeddings using a hierarchical model that maps bundle features to their purchase likelihood, as measured by the add-to-cart rate. We find that our embeddings-based heuristics are strong predictors of bundle success, robust across product categories, and generalize well to the retailer's entire assortment.

研究の動機と目的

  • 大規模でクロスカテゴリーオンライン小売環境における、実証的でスケーラブルな効果的なプロモーションバンドル設計手法の不足に対処すること。
  • 事前に割り当てられた補完性や代替性がなくても、歴史的購入行動および閲覧行動を活用して製品関係を推定するデータ駆動型アプローチを開発すること。
  • 米国の大手オンライン小売業者を対象とした大規模な現実世界実験を通じて、埋め込みに基づくヒューリスティックのバンドル成功予測能力をテストすること。
  • 埋め込みから得られる特徴量の階層的モデリングを用いて、小売業者の全製品アサortメントにわたるバンドルパフォーマンス予測を一般化すること。
  • 消費者の多様性志向行動に着目した「バリエーションバンドル」(不完全な代替品を用いたもの)の可能性を検討すること。

提案手法

  • 表現学習アプローチを用いて、歴史的購入データおよびクリックストリームデータから密度の高い連続的製品埋め込みを学習する。
  • 購入空間の埋め込みにおける近接性を製品の補完性のヒューリスティックとして、検索空間の埋め込みにおける近接性を代替性のヒューリスティックとして用いる。
  • これらのヒューリスティックを用いて、クロスカテゴリーや不完全な代替品を含むバリエーションバンドルを含む、複数の候補バンドルを各製品に対して生成する。
  • 米国の大手オンライン小売業者を対象とした現実世界実験を実施し、カートへの追加率を結果指標として用いてバンドルパフォーマンスを測定する。
  • 製品カテゴリごとに異なる切片と勾配を持つ階層的ロジスティック回帰を適用し、埋め込みに基づく特徴量を関数としてバンドル成功の確率をモデル化する。
  • このアプローチを転移学習として定式化:歴史的データ(ソースタスク)を活用して、現実世界実験による実証的ラベルを用いたバンドル選択(焦点タスク)を支援する。

実験結果

リサーチクエスチョン

  • RQ1購入および閲覧行動から得られる密度の高い製品埋め込みは、大規模でクロスカテゴリーオンライン小売環境において、効果的なプロモーションバンドルを予測できるか?
  • RQ2埋め込みに基づく補完性および代替性のヒューリスティックは、伝統的な理論的仮定と比較して、バンドル成功の予測にどの程度優れているか?
  • RQ3埋め込みに基づくバンドルヒューリスティックは、多様な製品カテゴリおよび小売業者の全製品アサortメントにわたってどの程度一般化可能か?
  • RQ4不完全な代替品から構成される「バリエーションバンドル」は、従来の補完的バンドルと比較してどの程度効果的か?
  • RQ5製品メタデータおよび事前処理変数を制御した状態で、埋め込みから得られる特徴量の予測力はどの程度か?

主な発見

  • 埋め込みに基づく補完性および代替性のヒューリスティックは、現実世界実験におけるカートへの追加率を指標として測定したところ、バンドル成功の強力な予測要因であることが判明した。
  • 本手法は製品カテゴリを問わず安定しており、飲料、スナック、洗濯用品においてクロスカテゴリーバンドルの潜在的効果が顕著に現れた。
  • お肉・魚介類製品は、缶詰および新鮮な野菜と好相性である一方、健康ケアおよびベビー用品はクロスカテゴリーバンドルの適性が低い。
  • 階層的ロジスティック回帰モデルは、埋め込み特徴量を用いて、小売業者の全製品アサortメントにわたるバンドルパフォーマンス予測を成功裏に一般化した。
  • 本アプローチにより、組み合わせ的に巨大なバンドル空間からの効率的フィルタリングが可能となり、ブルートフォース法に比べて大幅にスケーラビリティが向上した。
  • 本研究は、行動データに基づいて学習した機械学習モデルが、実世界の小売バンドルにおいて理論的仮定を上回ることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。