[论文解读] Scalable bundling via dense product embeddings
本文提出一种基于机器学习的可扩展、数据驱动的跨品类电商捆绑策略,通过从历史购买记录和点击流数据中学习密集的产品嵌入表示。该方法利用购买嵌入和搜索嵌入中的相似性作为互补性和替代性的启发式规则,通过大规模实地实验测试捆绑效果,并发现基于嵌入的启发式规则在各类品类中均能稳健预测捆绑成功,从而实现高效、可泛化的捆绑设计。
Bundling, the practice of jointly selling two or more products at a discount, is a widely used strategy in industry and a well examined concept in academia. Historically, the focus has been on theoretical studies in the context of monopolistic firms and assumed product relationships, e.g., complementarity in usage. We develop a new machine-learning-driven methodology for designing bundles in a large-scale, cross-category retail setting. We leverage historical purchases and consideration sets created from clickstream data to generate dense continuous representations of products called embeddings. We then put minimal structure on these embeddings and develop heuristics for complementarity and substitutability among products. Subsequently, we use the heuristics to create multiple bundles for each product and test their performance using a field experiment with a large retailer. We combine the results from the experiment with product embeddings using a hierarchical model that maps bundle features to their purchase likelihood, as measured by the add-to-cart rate. We find that our embeddings-based heuristics are strong predictors of bundle success, robust across product categories, and generalize well to the retailer's entire assortment.
研究动机与目标
- 解决大规模、跨品类零售环境中缺乏实证性、可扩展的促销捆绑设计方法的问题。
- 开发一种基于历史购买和浏览行为的数据驱动方法,以推断产品间关系,而无需预先指定互补性或替代性。
- 通过与美国在线零售商的大规模实地实验,测试基于嵌入的启发式方法对捆绑成功率的预测能力。
- 通过嵌入衍生特征的分层建模,将捆绑表现预测推广至零售商全部产品组合。
- 探索使用不完美替代品构建“多样化捆绑”的潜力,以激发消费者的多样化寻求行为。
提出的方法
- 使用表示学习方法,从历史购买记录和点击流数据中学习密集的连续产品嵌入表示。
- 将购买空间嵌入中的接近度作为产品互补性的启发式规则,将搜索空间嵌入中的接近度作为替代性的启发式规则。
- 利用这些启发式规则为每个产品生成多个候选捆绑,包括跨品类捆绑和使用不完美替代品的多样化捆绑。
- 与一家大型美国在线零售商合作开展实地实验,以加入购物车率作为结果指标,衡量捆绑表现。
- 应用具有按品类变化的截距和斜率的分层逻辑回归模型,将捆绑成功概率建模为基于嵌入特征的函数。
- 将该方法视为迁移学习:利用历史数据(源任务)来指导捆绑选择(焦点任务),并结合实地实验的实证标签。
实验结果
研究问题
- RQ1从购买和浏览行为中学习到的密集产品嵌入,能否在大规模、跨品类零售环境中预测有效的促销捆绑?
- RQ2基于嵌入的互补性和替代性启发式规则,与传统的理论驱动假设相比,在预测捆绑成功率方面表现如何?
- RQ3基于嵌入的捆绑启发式规则在多样化产品品类及零售商全部产品组合中,其泛化能力如何?
- RQ4与传统互补捆绑相比,由不完美替代品构成的“多样化捆绑”效果如何?
- RQ5在控制产品元数据和预处理变量的情况下,基于嵌入的特征具有多强的预测能力?
主要发现
- 基于嵌入的互补性和替代性启发式规则是捆绑成功率的强预测因子,其有效性通过实地实验中的加入购物车率得到验证。
- 该方法在各类产品品类中均表现稳健,其中饮料、零食和洗衣产品展现出显著的跨品类捆绑潜力。
- 肉类和海鲜产品与罐头食品及新鲜蔬果搭配效果良好,而保健产品和婴儿用品则不适合作为跨品类捆绑的候选。
- 分层逻辑回归模型成功地利用嵌入特征,将捆绑表现预测推广至零售商全部产品组合。
- 该方法能够高效过滤组合爆炸的捆绑空间,显著提升相比暴力枚举方法的可扩展性。
- 本研究证明,基于行为数据训练的机器学习模型在真实零售捆绑场景中,可超越基于理论的假设。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。