Skip to main content
QUICK REVIEW

[论文解读] The Structure of Collaborative Tagging Systems

Scott A. Golder, Bernardo A. Huberman|ArXiv.org|Aug 18, 2005
Complex Network Analysis Techniques参考文献 13被引用 837
一句话总结

本文分析了协作标签系统在结构和动态特性方面的表现,揭示了标签频率、用户行为以及标签共现中的稳定模式。基于大规模标签系统的实证数据,作者提出了一种基于模仿与共享知识的动态模型,解释了观察到的规律性,包括幂律标签分布和每个URL的稳定标签比例。

ABSTRACT

Collaborative tagging describes the process by which many users add metadata in the form of keywords to shared content. Recently, collaborative tagging has grown in popularity on the web, on sites that allow users to tag bookmarks, photographs and other content. In this paper we analyze the structure of collaborative tagging systems as well as their dynamical aspects. Specifically, we discovered regularities in user activity, tag frequencies, kinds of tags used, bursts of popularity in bookmarking and a remarkable stability in the relative proportions of tags within a given url. We also present a dynamical model of collaborative tagging that predicts these stable patterns and relates them to imitation and shared knowledge.

研究动机与目标

  • 理解网络平台中协作标签系统的结构与动态特性。
  • 识别用户标签行为中的规律性,如标签频率分布和活动爆发。
  • 研究标签比例在不同时间点对URL的稳定性。
  • 提出一个动态模型,解释通过模仿与共享知识而产生的稳定标签模式的形成机制。
  • 利用真实协作标签系统中的实证数据验证该模型。

提出的方法

  • 收集并分析了协作标签系统的大规模实证数据,重点关注用户标签行为与标签频率。
  • 应用统计分析方法,识别标签频率中的幂律分布以及书签活动的时间爆发特征。
  • 使用相关性与方差度量,评估不同时间段内URL关联标签相对比例的稳定性。
  • 基于模仿与共享知识,提出了一种协作标签的动态模型,模拟用户在标签过程中的行为。
  • 利用实证数据校准模型,并将其预测结果与观察到的标签分布与稳定性模式进行对比。
  • 采用数学建模方法,将观察到的规律性与模仿和共识形成等潜在社会与认知机制联系起来。

实验结果

研究问题

  • RQ1协作标签系统的结构与动态特性中,会涌现出哪些规律性?
  • RQ2给定URL关联的标签相对比例在时间上有多稳定?
  • RQ3导致观察到的标签频率幂律分布的机制是什么?
  • RQ4书签活动的爆发与标签流行度及用户行为之间有何关联?
  • RQ5模仿与共享知识在多大程度上能够解释观察到的稳定标签行为模式?

主要发现

  • 协作标签系统中的标签频率遵循幂律分布,表明少数标签被频繁使用,而大多数标签使用频率极低。
  • 特定URL关联的标签相对比例在长时间内保持显著稳定,不同时间段之间的相关性很高。
  • 用户活动表现出标签行为的爆发特征,尤其在热门内容上,表明其时间动态并非泊松过程。
  • 基于模仿与共享知识的动态模型成功再现了观察到的标签分布与比例的稳定模式。
  • 标签比例的稳定性表明,集体标签行为趋向于形成共享且一致的元数据表示。
  • 模型的预测与实证数据高度吻合,支持了模仿与共享知识是协作标签系统结构形成关键驱动力的假设。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。