[论文解读] Sequential Click Prediction for Sponsored Search with Recurrent Neural Networks
本文提出一种基于循环神经网络(RNN)的框架,用于在赞助搜索中建模用户行为序列,以提升点击率(CTR)预测性能。通过利用RNN的循环结构捕捉跨广告展示的时序依赖关系,该方法显著优于传统序列无关模型(如逻辑回归和前馈神经网络),在大规模商业搜索日志上实现了1.5–2%的绝对AUC提升。
Click prediction is one of the fundamental problems in sponsored search. Most of existing studies took advantage of machine learning approaches to predict ad click for each event of ad view independently. However, as observed in the real-world sponsored search system, user's behaviors on ads yield high dependency on how the user behaved along with the past time, especially in terms of what queries she submitted, what ads she clicked or ignored, and how long she spent on the landing pages of clicked ads, etc. Inspired by these observations, we introduce a novel framework based on Recurrent Neural Networks (RNN). Compared to traditional methods, this framework directly models the dependency on user's sequential behaviors into the click prediction process through the recurrent structure in RNN. Large scale evaluations on the click-through logs from a commercial search engine demonstrate that our approach can significantly improve the click prediction accuracy, compared to sequence-independent approaches.
研究动机与目标
- 解决现有点击预测模型将每个广告展示独立处理、忽略用户行为时序依赖关系的局限性。
- 探究序列化用户行为(如先前点击、停留时间及查询历史)如何影响未来的点击概率。
- 开发一种深度学习框架,自动从原始点击日志中学习并利用复杂的序列依赖关系。
- 验证RNN在建模赞助搜索点击预测中长期与短期行为模式方面的有效性。
提出的方法
- 将每位用户的历史广告展示记录建模为时间有序序列,其中每个元素包含查询词、广告文本、点击状态及停留时间等特征。
- 使用具有隐藏状态的循环神经网络(RNN),通过跨展示累积序列信息,使模型能够学习时序依赖关系。
- 使用通过时间反向传播(BPTT)进行训练,通过展开步长显式建模短时程依赖关系。
- 在推理阶段,保持跨序列的循环状态,以保留历史上下文,确保预测过程中的序列建模能力。
- 将RNN输出与最终分类器(如Softmax或Sigmoid)结合,预测每个广告展示的点击概率。
- 使用商业搜索引擎的时间戳日志构建训练与测试序列,确保模型具备真实世界适用性。
实验结果
研究问题
- RQ1用户行为中的时序依赖关系(如先前点击与停留时间)如何影响未来的广告点击概率?
- RQ2RNN能否有效建模赞助搜索点击行为中的长期与短期序列依赖关系?
- RQ3与序列无关模型相比,引入序列历史在多大程度上提升了点击预测的准确性?
- RQ4RNN模型的性能对历史序列长度及训练过程中展开步数的敏感程度如何?
主要发现
- 在大规模商业点击率日志上,RNN模型相较于逻辑回归和前馈神经网络等基线模型,AUC绝对提升达1.5–2%。
- 推理阶段移除循环状态后,AUC从89.75%降至88.25%,证实序列记忆对性能至关重要。
- 随着历史序列长度增加,模型性能持续提升,且在累积周期越长时,RNN相较于基线模型的相对增益越大。
- BPTT中的最优展开步长为3;超过此值后性能下降,归因于梯度消失,表明建模深度与稳定性之间存在权衡。
- RNN能有效捕捉短时程依赖(通过展开)与长时程依赖(通过循环权重),解释了其优异性能表现。
- 即使在历史数据稀疏的罕见情况下,RNN仍保持优越性能,展现出对稀疏序列的强鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。