Skip to main content
QUICK REVIEW

[论文解读] Clustering and preferential attachment in growing networks

M. E. J. Newman|Apr 11, 2001
Complex Network Analysis Techniques被引用 22
一句话总结

本文利用来自洛斯阿拉莫斯预印本档案库和Medline的时序解析数据,为增长中的科学合作网络中的聚类和优先连接提供了实证证据。结果表明,新合作的概率随共同合作者数量和已有合作者数量的增加而上升,且优先连接紧密遵循线性趋势,支持了网络中幂律度分布的理论基础。

ABSTRACT

We study empirically the time evolution of scientific collaboration networks in physics and biology. In these networks, two scientists are considered connected if they have coauthored one or more papers together. We show that the probability of scientists collaborating increases with the number of other collaborators they have in common, and that the probability of a particular scientist acquiring new collaborators increases with the number of his or her past collaborators. These results provide experimental evidence in favor of previously conjectured mechanisms for clustering and power-law degree distributions in networks.

研究动机与目标

  • 通过实证方法检验网络增长中聚类和优先连接机制的假设。
  • 确定合作概率是否随共同合作者数量和已有合作者数量的增加而上升。
  • 评估优先连接是否遵循线性趋势,这将解释幂律度分布的成因。
  • 利用科学合作数据库的时序解析数据,明确网络增长顺序,消除歧义。

提出的方法

  • 基于洛斯阿拉莫斯预印本档案库(1995–2000)和Medline(1994–1999)的数据构建合作网络,使用出版顺序作为合作时间的代理指标。
  • 定义相对概率 $ R_k $,表示新边连接到度为 $ k $ 的顶点的概率,并通过 $ N(t)/n_k(t) $ 加权以校正度分布偏差。
  • 通过时间有序数据追踪网络结构的演化,计算共同顶点的两个邻居之间也相连的概率,以测量聚类。
  • 采用基于直方图的加权方法估计 $ R_k $,并通过归一化评估其与均匀连接的偏离程度。
  • 对 $ R_k $ 拟合幂律模型,以检验线性($ \nu = 1 $)或次线性($ \nu < 1 $)的优先连接。
  • 在两个大规模数据库间比较结果,以验证发现的一致性和稳健性。

实验结果

研究问题

  • RQ1两位科学家之间的合作概率是否随其共同合作者数量的增加而上升?
  • RQ2科学家获得新合作者的概率是否随其已有合作者数量的增加而上升?
  • RQ3网络增长中的优先连接是否如理论模型所预测的那样呈线性?
  • RQ4观察到的度分布与幂律的偏离程度如何?这种偏离是否与线性优先连接的失效相关?

主要发现

  • 合作概率随共同合作者数量的增加而显著上升,为基于相互引荐的聚类机制提供了强有力的实证支持。
  • 获得新合作者的概率随已有合作者数量的线性增加,证实优先连接是主导的网络增长机制。
  • 对于低至中等度数,相对连接概率 $ R_k $ 随 $ k $ 呈线性增长,Medline 的 $ \nu = 1.04 \pm 0.04 $,洛斯阿拉莫斯档案库的 $ \nu = 0.89 \pm 0.98 $,两者均与线性优先连接一致。
  • 在高 $ k $ 值处(物理领域约150,生物医学领域约600),$ R_k $ 与线性的偏离与度分布的观测截断点一致,表明优先连接存在自然上限。
  • 研究结果与早期时间分辨率较低的研究相矛盾,后者发现次线性连接($ \nu \approx 0.8 $),而本研究支持标准线性模型作为底层机制。
  • 本研究首次通过时序解析的实证方法,直接验证了聚类和线性优先连接作为网络增长及幂律度分布驱动因素的作用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。