Skip to main content
QUICK REVIEW

[论文解读] Folksonomy as a Complex Network

Kaikai Shen, Lide Wu|ArXiv.org|Sep 23, 2005
Complex Network Analysis Techniques参考文献 3被引用 56
一句话总结

本文将 Del.icio.us 的分类标签体系建模为基于标签的复杂网络,并证明其同时具备小世界和无标度特性。基于2005年3月的9,804个标签的静态快照,研究发现平均路径长度较短(3.40),聚类系数较高(0.06),且度分布服从幂律分布(γ ≈ 1.418),证实了该网络的复杂结构。

ABSTRACT

Folksonomy is an emerging technology that works to classify the information over WWW through tagging the bookmarks, photos or other web-based contents. It is understood to be organized by every user while not limited to the authors of the contents and the professional editors. This study surveyed the folksonomy as a complex network. The result indicates that the network, which is composed of the tags from the folksonomy, displays both properties of small world and scale-free. However, the statistics only shows a local and static slice of the vast body of folksonomy which is still evolving.

研究动机与目标

  • 探究由用户生成标签构成的分类标签网络是否表现出小世界和无标度等复杂网络特性。
  • 将分类标签网络建模为无向、无权图,其中标签为节点,同一内容中同时出现的标签之间构成边。
  • 使用标准指标(度分布、聚类系数和平均路径长度)评估分类标签网络的结构特性。
  • 确定分类标签网络的结构是否支持高效的信息检索并反映潜在的社会组织结构。

提出的方法

  • 从2005年3月26日至27日24小时内收集的 Del.icio.us RSS 订阅源数据中构建标签共现网络,仅使用 URL、时间戳和标签信息。
  • 将唯一标签定义为节点,并在同时出现在同一书签中的标签之间建立无向边。
  • 通过对数坐标图和互补累积分布函数(CCDF)测量度分布,以评估无标度行为,并估算幂律指数 γ。
  • 计算平均路径长度和聚类系数,以评估小世界特性,并与 Erdős–Rényi 随机网络基准进行比较。
  • 使用相关系数 R 等统计指标验证幂律拟合效果及网络结构。

实验结果

研究问题

  • RQ1由用户标签构成的分类标签网络是否表现出小世界特性,如短平均路径长度和高聚类系数?

主要发现

  • 分类标签网络的平均路径长度为 3.40,与具有相似规模和平均度的随机网络的预期值(3.83)相近,表明其具有小世界行为。
  • 聚类系数(C = 0.06)显著高于随机网络的聚类系数(C_random ≈ 0.001),证实了其具有高度的局部聚类和小世界结构。
  • 度分布符合幂律分布,幂律指数 γ ≈ 1.418,表现为对数坐标图中的线性趋势,且 CCDF 图中相关系数 R 较高,证实其具有无标度特性。
  • 连接度最高的标签——如 'blog'(1,504 个连接)、'web'(1,465 个连接)和 'software'(1,297 个连接)——表现出典型的无标度网络重尾分布。
  • 尽管采用静态快照,该网络的结构特性表明分类标签体系本质上具有支持高效导航和信息检索的组织方式。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。