[论文解读] Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings
本文提出 Meta-Embedding,一种元学习方法,通过为新广告 ID 生成高质量的初始嵌入表示,以提升冷启动和预热阶段的点击率(CTR)预测性能。通过在先前学习过的广告上使用基于梯度的元学习训练参数化嵌入生成器,该方法在真实数据集上的六种最先进 CTR 模型中,相较于随机初始化或查找表初始化,实现了更快的收敛速度和更优的性能表现。
Click-through rate (CTR) prediction has been one of the most central problems in computational advertising. Lately, embedding techniques that produce low-dimensional representations of ad IDs drastically improve CTR prediction accuracies. However, such learning techniques are data demanding and work poorly on new ads with little logging data, which is known as the cold-start problem. In this paper, we aim to improve CTR predictions during both the cold-start phase and the warm-up phase when a new ad is added to the candidate pool. We propose Meta-Embedding, a meta-learning-based approach that learns to generate desirable initial embeddings for new ad IDs. The proposed method trains an embedding generator for new ad IDs by making use of previously learned ads through gradient-based meta-learning. In other words, our method learns how to learn better embeddings. When a new ad comes, the trained generator initializes the embedding of its ID by feeding its contents and attributes. Next, the generated embedding can speed up the model fitting during the warm-up phase when a few labeled examples are available, compared to the existing initialization methods. Experimental results on three real-world datasets showed that Meta-Embedding can significantly improve both the cold-start and warm-up performances for six existing CTR prediction models, ranging from lightweight models such as Factorization Machines to complicated deep models such as PNN and DeepFM. All of the above apply to conversion rate (CVR) predictions as well.
研究动机与目标
- 解决 CTR 预测中的冷启动问题,即新广告缺乏足够训练数据以实现有效的嵌入学习。
- 通过学习更优的初始嵌入表示,提升新广告在冷启动和预热阶段的性能表现。
- 开发一种可泛化的通用方法,适用于具有嵌入层和多层感知机(MLP)结构的多样化深度学习 CTR 模型。
- 在广告上线后仅使用少量标注样本,即可实现新广告嵌入的快速适应。
- 弥合表示学习与元学习之间的鸿沟,以增强在线广告系统性能。
提出的方法
- 提出一种元学习框架,训练一个嵌入生成器,根据广告 ID 的特征和属性生成其初始嵌入表示。
- 在先前训练过的广告上进行两阶段模拟,以在元训练过程中模拟冷启动和预热场景。
- 利用基于梯度的元学习(受 MAML 启发)优化生成器,使其在新广告任务上具备良好的泛化能力。
- 使用统一损失函数进行生成器训练,以平衡冷启动和预热阶段的性能表现。
- 推理阶段,将新广告的特征输入已训练好的生成器,生成初始嵌入,替代随机或查找表初始化方式。
- 将 Meta-Embedding 生成器无缝集成到现有 CTR 模型(如 FM、PNN、DeepFM)中,无需修改网络架构。
实验结果
研究问题
- RQ1元学习方法是否能显著提升新广告在冷启动阶段的 CTR 预测准确率?
- RQ2所提出的 Meta-Embedding 方法是否能加速在有限标注数据下的预热阶段模型收敛?
- RQ3同一元学习得到的嵌入生成器是否能在具有嵌入层和 MLP 组件的多种深度 CTR 模型中实现良好泛化?
- RQ4在冷启动和预热阶段性能方面,Meta-Embedding 与随机初始化或查找表初始化相比表现如何?
- RQ5该方法是否可扩展至转化率(CVR)预测,并取得类似性能提升?
主要发现
- Meta-Embedding 在三个真实世界数据集上的六种最先进 CTR 模型中,显著提升了冷启动阶段的 CTR 预测性能。
- 该方法加速了预热阶段的模型收敛,在使用更少标注样本的情况下,性能优于基线初始化方法。
- 实验结果表明,冷启动和预热阶段均实现一致性能提升,无论是在轻量级模型(如因子分解机)还是深度模型(如 PNN、DeepFM)中均有显著增益。
- 所提出方法优于随机初始化和查找表初始化,证明了元学习嵌入在新广告 ID 上的有效性。
- Meta-Embedding 同样提升了转化率(CVR)预测性能,表明其在在线广告任务中具有广泛适用性。
- 该方法具备通用性,与现有 CTR 预测中使用的深度学习架构完全兼容,无需模型微调或结构修改。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。