Skip to main content
QUICK REVIEW

[论文解读] Collaborative Topic Regression with Social Matrix Factorization for Recommendation Systems

Sanjay Purushotham, Yan Liu|arXiv (Cornell University)|Jun 18, 2012
Recommender Systems and Techniques参考文献 8被引用 135
一句话总结

本文提出了一种分层贝叶斯模型,通过协同主题回归与社交矩阵分解,联合建模用户评分、社交网络关系以及潜在主题。通过将主题建模与矩阵分解相结合,该模型能自动推断出有意义的主题和社交影响,相较于最先进方法在两个大规模数据集上表现更优,尤其在预测音乐偏好之外的书签行为方面表现突出。

ABSTRACT

Social network websites, such as Facebook, YouTube, Lastfm etc, have become a popular platform for users to connect with each other and share content or opinions. They provide rich information for us to study the influence of user's social circle in their decision process. In this paper, we are interested in examining the effectiveness of social network information to predict the user's ratings of items. We propose a novel hierarchical Bayesian model which jointly incorporates topic modeling and probabilistic matrix factorization of social networks. A major advantage of our model is to automatically infer useful latent topics and social information as well as their importance to collaborative filtering from the training data. Empirical experiments on two large-scale datasets show that our algorithm provides a more effective recommendation system than the state-of-the art approaches. Our results reveal interesting insight that the social circles have more influence on people's decisions about the usefulness of information (e.g., bookmarking preference on Delicious) than personal taste (e.g., music preference on Lastfm). We also examine and discuss solutions on potential information leak in many recommendation systems that utilize social information.

研究动机与目标

  • 通过在协同过滤中利用社交网络信息,提升推荐准确率。
  • 在统一的概率框架中联合建模用户评分、社交连接与潜在主题。
  • 从训练数据中自动推断主题的重要性和社交影响,无需人工特征工程。
  • 探究社交圈在影响用户对信息有用性(例如,书签行为)的决策方面,是否比在影响个人品味(例如,音乐偏好)方面更具影响力。
  • 通过严格的评估与模型设计,解决社交推荐系统中潜在的信息泄露问题。

提出的方法

  • 该模型采用分层贝叶斯框架,结合协同主题回归与社交矩阵分解。
  • 通过生成过程联合建模用户-项目评分、社交网络链接与潜在主题。
  • 对用户生成内容(例如标签、评论)应用主题建模,以提取影响偏好的潜在主题。
  • 社交矩阵分解通过网络中的社交连接捕捉用户相似性与影响力。
  • 利用变分推理从观测数据中推断用户特定的主题权重与社交影响参数。
  • 联合似然函数结合评分预测、主题分配与社交链接概率,以优化模型。

实验结果

研究问题

  • RQ1社交网络信息在多大程度上能提升推荐系统中协同过滤的性能?
  • RQ2社交圈在多大程度上影响用户对信息有用性与个人品味的决策?
  • RQ3能否在无需先验知识的情况下,通过统一模型同时推断潜在主题与社交影响?
  • RQ4社交推荐系统中的信息泄露会产生何种影响,以及如何缓解?
  • RQ5所提出的模型在真实世界数据集上与最先进方法相比表现如何?

主要发现

  • 所提出的模型在两个大规模数据集上显著优于最先进推荐系统,展现出更高的预测准确率。
  • 社交影响对信息有用性决策(例如,Delicious上的书签行为)的影响,强于对个人品味决策(例如,Last.fm上的音乐偏好)的影响。
  • 该模型能从数据中自动推断出有意义的潜在主题与社交影响权重,无需人工特征工程。
  • 实证结果表明,同时引入主题与社交结构可提升评分预测的泛化能力与鲁棒性。
  • 本研究识别并解决了社交推荐系统中潜在的信息泄露问题,强调了设计严谨评估协议的重要性。
  • 该模型通过在一个统一的概率框架中联合建模用户评分、社交链接与主题分布,实现了卓越的性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。