Skip to main content
QUICK REVIEW

[论文解读] A Personalized Tag-Based Recommendation in Social Web Systems

Frederico Araújo Dur�ão, Peter Dolog|arXiv (Cornell University)|Mar 1, 2012
Recommender Systems and Techniques参考文献 5被引用 30
一句话总结

本文提出了一种针对社交网络系统的个性化基于标签的推荐系统,通过引入标签流行度、代表性以及用户-标签亲和力来增强余弦相似度,从而提升推荐的相关性。在来自12个国家的38名用户使用Del.icio.us数据进行评估,推荐接受率达到59%,表明尽管存在语义模糊性和低标签用户等挑战,系统仍表现出令人满意的性能。

ABSTRACT

Tagging activity has been recently identified as a potential source of knowledge about personal interests, preferences, goals, and other attributes known from user models. Tags themselves can be therefore used for finding personalized recommendations of items. In this paper, we present a tag-based recommender system which suggests similar Web pages based on the similarity of their tags from a Web 2.0 tagging application. The proposed approach extends the basic similarity calculus with external factors such as tag popularity, tag representativeness and the affinity between user and tag. In order to study and evaluate the recommender system, we have conducted an experiment involving 38 people from 12 countries using data from Del.icio.us, a social bookmarking web system on which users can share their personal bookmarks.

研究动机与目标

  • 开发一种利用社交书签系统中用户生成标签的个性化推荐系统。
  • 通过整合标签流行度、代表性以及用户-标签亲和力等外部因素,提升推荐的准确性。
  • 在真实世界、非受控环境中对多样化用户进行评估,检验系统的有效性。
  • 识别基于标签推荐的局限性,特别是语义模糊性和稀疏标签问题。
  • 探索未来改进方向,如语义相似度计算和标签目的推断。

提出的方法

  • 通过标签向量的余弦相似度计算网页之间的基本相似度。
  • 将标签流行度定义为某标签在所有书签中出现的频率。
  • 使用该页面标签集合内的词频计算每页的标签代表性。
  • 将用户-标签亲和力量化为用户将特定标签应用于不同资源的次数。
  • 将所有因素整合到一个归一化公式中,对每位用户的推荐书签进行排序。
  • 通过一项包含38名来自12个国家参与者的用户研究,评估用户对推荐书签的满意度。

实验结果

研究问题

  • RQ1社交书签系统中的标签能否有效支持个性化推荐?
  • RQ2标签流行度和用户-标签亲和力等外部因素如何提升推荐质量?
  • RQ3语义模糊性和低标签密度对推荐成功率有何影响?
  • RQ4用户满意度在不同背景和标签行为的用户中如何变化?
  • RQ5在真实环境中,所提出的多因素方法在多大程度上优于基础相似度方法?

主要发现

  • 58%的参与者获得了至少三个超过接受阈值的推荐,表明推荐数量方面取得中等程度的成功。
  • 所有推荐中59%被用户接受,表明整体接受率令人满意。
  • 42%的参与者获得的推荐少于三个,其中16名用户仅接受了一个或两个推荐,表明推荐存在显著被拒绝的情况。
  • 7名用户拒绝了35条推荐中的28条(占80%),主要原因是语义不匹配或内容无关,尽管标签语法正确。
  • 主要挑战包括语义模糊性(如同义词和多义词)、标签与资源之间关系不明确,以及标签数量不足导致难以推断用户偏好。
  • 研究结论认为,尽管该方法有效且具有前景,但仍需改进,特别是在处理语义模糊性和识别标签目的方面。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。