[论文解读] Online Dating Recommendations: Matching Markets and Learning Preferences
本文提出了一种在线恋爱推荐的双向匹配框架,通过基于LDA的概率模型联合建模发送方和接收方偏好,该模型基于消息行为和用户资料进行训练。通过引入学习到的接收方偏好,该框架相比仅基于发送方的推荐,将成功匹配率提高了高达48%,证明了从行为中学习真实偏好而非依赖自我报告特征的价值。
Recommendation systems for online dating have recently attracted much attention from the research community. In this paper we proposed a two-side matching framework for online dating recommendations and design an LDA model to learn the user preferences from the observed user messaging behavior and user profile features. Experimental results using data from a large online dating website shows that two-sided matching improves significantly the rate of successful matches by as much as 45%. Finally, using simulated matchings we show that the the LDA model can correctly capture user preferences.
研究动机与目标
- 解决在线恋爱推荐中仅考虑发送方偏好的不平衡问题,该问题导致消息量过高而回复率过低。
- 将在线恋爱的双向特性建模为匹配市场,要求发送方和接收方的偏好均得到满足才能实现成功匹配。
- 从观察到的消息行为和用户资料特征中学习接收方偏好,而非依赖可能不准确的自我声明偏好。
- 证明在推荐中引入学习到的接收方偏好可显著提高成功匹配率(以回复率衡量)。
- 证明LDA能够有效将非结构化用户文本(如自我描述)作为特征用于偏好学习。
提出的方法
- 将在线恋爱建模为双向匹配市场,仅当双方都有较高可能积极回应时才进行推荐。
- 定义一个优化问题,以在接收方和发送方容量约束下最大化期望效用(总回复数)。
- 使用基于概率的LDA模型,从用户资料特征和观察到的消息交互中学习用户偏好。
- 在用户生成的文本(如自我描述)和消息行为上训练LDA模型,以推断潜在偏好主题。
- 将学习到的偏好概率(f(s,r) 和 g(r,s))整合到双向匹配优化中,以指导推荐。
- 使用模拟匹配验证LDA模型是否能准确捕捉用户偏好。
实验结果
研究问题
- RQ1能否从消息行为和用户资料中有效学习在线恋爱中的接收方偏好,而非依赖自我报告偏好?
- RQ2与单边仅基于发送方的推荐相比,同时考虑发送方和接收方偏好的双向匹配框架是否能显著提高匹配成功率?
- RQ3基于LDA的模型在预测用户回复行为方面,与声明偏好相比表现如何?
- RQ4LDA能否有效从非结构化用户文本(如自我描述)中提取有意义的偏好表征?
- RQ5所提出的双向匹配框架在大规模在线恋爱平台中是否具备可扩展性和实用性?
主要发现
- 结合学习到的接收方偏好的双向匹配框架,相比仅基于发送方的推荐,将成功匹配率(以首次接触回复率衡量)提高了高达48%。
- 在消息行为和用户资料上训练的LDA模型,在预测接收方是否会回复消息方面,优于自我声明的偏好。
- 模拟匹配结果证实,LDA模型能够正确分类相似用户并学习其潜在偏好。
- 该框架成功利用非结构化文本(如自我描述)作为输入特征,无需人工标注。
- 基于图的协同过滤在大规模稀疏恋爱网络中表现较差,原因在于人为聚类以及相似追求者之间的竞争。
- 所提出的概率优化框架避免了二元整数规划的计算复杂性和次优性,实现了可扩展的部署。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。